[go: up one dir, main page]

KR20220113442A - 입자 전달 시스템 - Google Patents

입자 전달 시스템 Download PDF

Info

Publication number
KR20220113442A
KR20220113442A KR1020227022874A KR20227022874A KR20220113442A KR 20220113442 A KR20220113442 A KR 20220113442A KR 1020227022874 A KR1020227022874 A KR 1020227022874A KR 20227022874 A KR20227022874 A KR 20227022874A KR 20220113442 A KR20220113442 A KR 20220113442A
Authority
KR
South Korea
Prior art keywords
xdp
sequence
seq
protein
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020227022874A
Other languages
English (en)
Inventor
벤자민 오크스
션 히긴스
한나 스피너
사라 데니
브렛 티 스탈
키안 테일러
캐서린 바니
이사벨 콜린
마루프 아딜
매튜 가드너
트렌트 곰버그
가야트리 비자야쿠마르
Original Assignee
스크라이브 테라퓨틱스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스크라이브 테라퓨틱스 인크. filed Critical 스크라이브 테라퓨틱스 인크.
Publication of KR20220113442A publication Critical patent/KR20220113442A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16023Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Seeds, Soups, And Other Foods (AREA)
  • Medicinal Preparation (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

임의의 유형의 페이로드의 전달에 유용한 전달 입자 시스템(XDP)이 본 명세서에 제공된다. 일부 실시형태에서, 관심 표적 세포에 대한 친화성을 갖는 XDP 입자 시스템은 표적 세포에서 핵산의 변형을 위해 CRISPR/Cas 폴리펩티드(예를 들어, CasX 단백질) 및 가이드 핵산(gNA)을 전달하는 데 사용된다. 또한 이러한 세포에서 핵산을 변형하기 위해 이러한 XDP를 만들고 사용하는 방법이 제공된다.

Description

입자 전달 시스템
관련 출원에 대한 교차 참조
본 출원은 2019년 12월 6일에 출원된 미국 가특허 출원 번호 62/944,982, 2020년 1월 31일에 출원된 62/968,915, 2020년 2월 28일에 출원된 62/983,460, 2020년 6월 5일에 출원된 63/035,576 및 2020년 12월 3일에 출원된 63/120,864에 대한 우선권을 주장하며, 그 각각의 내용은 그 전체가 참고로 본 명세서에 포함된다.
서열 목록의 참조에 의한 통합
본 출원은 EFS-WEB를 통해 ASCII 형식으로 제출되었고 그 전체가 참고로 본 명세서에 합체된 서열 목록을 함유한다. 2020년 12월 4일에 생성된 상기 ASCII 사본은 SCRB_024_05WO_SeqList_ST25.txt로 명명되고 크기는 3.14MB이다.
신체의 특정 세포 또는 기관에 단백질 또는 핵산 치료제의 전달은 일반적으로 표적화 양식 또는 비히클이 치료제에 연결되거나 치료제를 함유하는 복잡한 시스템을 요한다. 단일클론 항체와 같은 고도로 선택적인 표적화 방식을 사용하더라도, 표적 세포 또는 기관에 대한 시스템의 선택성은 절대적이지 않고 표적-외 독성이 결과로 나타날 수 있다.
바이러스의 레트로바이러스과 패밀리는 인간 및 기타 포유동물 종에서 긴 잠복기를 특징으로 하는 만성 및 치명적인 질환을 야기하는 여러 바이러스의 속을 포괄한다. 레트로바이러스과 패밀리는 오소레트로바이러스아과(렌티바이러스, 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스) 및 스푸마레트로바이러스아과를 포함한다. 가장 잘 알려진 렌티바이러스는 후천성 면역 결핍 증후군(AIDS)을 유발하는 인간 면역결핍 바이러스(HIV)이다. 모든 레트로바이러스와 마찬가지로 렌티바이러스는 5'-gag-pol-env-3'인 순서로 바이러스 단백질을 코딩하는 gag, pol 및 env 유전자를 갖는다. 렌티바이러스 시스템은 유전자 편집 시스템을 함유하는 바이러스-유사 입자(VLP)의 생성에 의하여 인간 또는 동물 세포 안으로 유전자 편집 시스템을 도입하도록 조정되었다. 레트로바이러스의 시스템은 분열 및 비-분열 세포의 고효율 감염, 이식유전자의 장기간 안정적인 발현, 및 낮은 면역원성을 포함하여, 다른 유전자-요법 방법에 비해 장점이 있다. 렌티바이러스는 PDGF(혈소판-유래 성장 인자)를 인코딩하는 유전자를 갖는 당뇨병 마우스의 형질도입에 성공적으로 사용되었으며, 이 요법은 인간에서의 사용이 고려되고 있다(Lee JA, 등 Lentiviral transfection with the PDGF-B gene improves diabetic wound healing. Plast. Reconstr. Surg. 116 (2): 532 (2005)). 그러나, VLP에서 CRISPR 뉴클레아제와 같은 특정 치료제의 사용에 있어 하나의 주요한 어려움은 특히 플라스미드/바이러스 벡터를 통한 것과 같은 전통적인 발현 방법을 사용할 때 뉴클레아제의 장기간 발현과 함께 표적-외 효과이다. 따라서, 바이러스 벡터로부터 유래된 입자를 사용한 유전자 편집 시스템의 전달을 위한 개선된 시스템에 대한 요구가 남아 있다.
본 개시내용은 단백질, 핵산, 소분자 등을 포함하는 치료 페이로드를 표적 세포 및 조직으로 전달하기 위한 전달 입자(XDP) 시스템을 제공한다.
일부 실시형태에서, XDP 시스템은 레트로바이러스 gag 폴리단백질, 치료 페이로드, 및 향성 인자의 전부 또는 일부로부터 선택된 성분을 인코딩하는 핵산을 포함하고, 여기서 향성 인자는 표적 세포 마커에 대한 당단백질, 항체 단편, 수용체 및 리간드로 구성된 군으로부터 선택된다. 전기한 것의 일 실시형태에서, 향성 인자는 표 4에 제시된 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97 %, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질이다. 특정 실시형태에서, 당단백질은 VSV-G이다. 특정 실시형태에서, 당단백질은 서열번호: 438의 서열을 포함한다.
치료 페이로드는 단백질, 핵산, 또는 단백질과 핵산 둘 모두일 수 있다. XDP 시스템의 일부 실시형태에서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택된다. 일 실시형태에서, 치료 페이로드는 클래스 1 또는 클래스 2 CRISPR 단백질이고, 여기서 클래스 2 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된다. 일 실시형태에서, 클래스 2 CRISPR 유형 V 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택되고, 여기서 CasX는 표 1, 7, 8, 9, 또는 11에 제시된 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, CasX는 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함한다. 일부 실시형태에서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택되는 핵산이고, 여기서 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적이고, 여기서 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함한다.
일부 실시형태에서, XDP 시스템은 하나 이상의 프로테아제 절단 부위, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR), 레트로바이러스 gag-pol 폴리단백질, 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 인코딩하는 핵산을 추가로 포함한다. 일부 실시형태에서, XDP 시스템의 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되며 여기서 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되고, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스로 구성된 군에서 선택된다.
일부 실시형태에서, XDP 시스템의 성분은 단일 핵산, 2개의 핵산, 3개의 핵산, 4개의 핵산, 또는 5개의 핵산 상에 인코딩되고, 핵산은 도 36-68 중 어느 하나에 따라 구성된다. 일부 실시형태에서, XDP 시스템의 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234-339의 서열의 군으로부터 선택된 핵산에 의해 인코딩된다.
일부 실시형태에서, XDP 시스템의 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블링될 수 있다. 전기한 실시형태에서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화된다. 치료 페이로드가 CasX 및 가이드 RNA를 포함하는 특정 실시형태에서, CasX 및 가이드 RNA는 리보핵단백질 복합체(RNP)로서 복합화되고, 선택적으로, 공여자 주형은 또한 XDP에 캡슐화된다. 또 다른 특정 실시형태에서, XDP의 자가-어셈블리 시 XDP 표면에 향성 인자가 통합된다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA) 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 감만레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA) 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 렌티바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
CasX 시스템의 일부 실시형태에서, CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK (서열번호: 131), PAAKRVKLD (서열번호: 132), RQRRNELKRSP (서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열번호: 135), VSRKRPRP (서열번호: 136), PPKKARED (서열번호: 137), PQPKKKPL (서열번호: 138), SALIKKKKKMAP (서열번호: 139), DRLRR (서열번호: 140), PKQKKRK (서열번호: 141), RKLKKKIKKL (서열번호: 142), REKKKFLKRR (서열번호: 143), KRKGDEVDGVDEVAKKKSKK (서열번호: 144), RKCLQAGMNLEARKTKK (서열번호: 145), PRPRKIPR (서열번호: 146), PPRKKRTVV (서열번호: 147), NLSKKKKRKREK (서열번호: 148), RRPSRPFRKP (서열번호: 149), KRPRSPSS (서열번호: 150), KRGINDRNFWRGENERKTR (서열번호: 151), PRPPKMARYDN (서열번호: 152), KRSFSKAF (서열번호: 153), KLKIKRPVK (서열번호: 154), PKTRRRPRRSQRKRPPT (서열번호: 156), RRKKRRPRRKKRR (서열번호: 159), PKKKSRKPKKKSRK (서열번호: 160), HKKKHPDASVNFSEFSK (서열번호: 161), QRPGPYDRPQRPGPYDRP (서열번호: 162), LSPSLSPLLSPSLSPL (서열번호: 163), RGKGGKGLGKGGAKRHRK (서열번호: 164), PKRGRGRPKRGRGR (서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN (서열번호: 157), PKKKRKVPPPPAAKRVKLD (서열번호: 155), 및 PKKKRKVPPPPKKKRKV (서열번호: 166)로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치된다.
XDP 시스템의 일부 실시형태에서, 비-레트로바이러스의 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택된다.
다른 양태에서, 본 개시내용은 전술한 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포를 제공하며, 여기서 세포는 패키징 세포이다. 일부 실시형태에서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택된다.
다른 양태에서, 본 개시내용은 치료 페이로드를 포함하는 XDP를 제조하는 방법을 제공하며, 상기 방법은 XDP가 생성되도록 하는 조건 하에서 임의의 실시형태의 패키징 세포를 증식시키는 것, 및 패키징 세포에 의해 생성된 XDP를 수확하는 것을 포함한다. 본 개시내용은 전술한 방법에 의해 생성된 XDP를 추가로 제공한다. 특정 실시형태에서, XDP는 CasX 및 가이드 RNA의 RNP의 치료 페이로드, 및 선택적으로, 본 명세서에 개시된 임의의 실시형태의 공여자 주형을 포함한다.
다른 양태에서, 본 개시내용은 세포에서 표적 핵산 서열을 변형시키는 방법을 제공하며, 상기 방법은 세포를 본 명세서에 개시된 임의의 실시형태의 RNP를 포함하는 XDP와 접촉시키는 것을 포함하고, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA, 및 선택적으로 공여자 주형 핵산 서열을 포함하는 RNP를 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함한다. 일부 경우에, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함한다. 다른 경우에, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함한다. 또 다른 경우에, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함한다. 일 실시형태에서, 세포는 시험관내 또는 생체외에서 변형된다. 또 다른 실시형태에서, 세포는 생체내에서 변형된다. 전술한 실시형태에서, XDP는 치료적으로 유효한 용량으로 대상체에게 투여되며, 여기서 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체이다. 일부 실시형태에서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척수강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여된다. 일부 실시형태에서, 치료적으로 유효한 용량은 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg이다. 일부 실시형태에서, XDP는 XDP의 치료적으로 유효한 용량을 사용하여 하나 이상의 연속 용량을 포함하는 치료 요법에 따라 대상체에게 투여된다. 일부 실시형태에서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여된다.
또 다른 양태에서, 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한 XDP 입자, 및 XDP 시스템이 본 명세서에서 제공된다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 동일한 정도로 참고로 본 명세서에 포함된다. 2020년 6월 5일에 출원된 PCT/US2020/036505 및 2020년 12월 3일에 출원된 "조작된 CasX 시스템"이라는 제목의 미국 가출원의 내용은, 두 출원 모두 CasX 변이체 및 gNA 변종을 개시하는 것으로, 그 전체로 본 명세서에 참고로 포함된다.
발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 발명의 원리가 활용되는 예시적인 실시형태를 제시하는 다음의 상세한 설명 및 다음 첨부 도면을 참고하여 얻어질 것이다:
도 1은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 2는 실시예 1에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한, StX2의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 3은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 4는 실시예 2에 기재된 CasX 작제물을 어셈블링하는데 사용된 pSTX34 플라스미드에서 성분의 조직화를 보여주는 개략도이다.
도 5는 실시예 2에 기재된 CasX 119 변이체를 생성하는 단계를 보여주는 개략도이다.
도 6은 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 7은 실시예 2에 기재된 슈퍼덱스 200 16/600pg 겔 여과의 크로마토그램을 나타낸다.
도 8은 실시예 2에 기재된 콜로이드성 쿠마시로 염색된 겔 여과 샘플의 SDS-PAGE 겔을 나타낸다.
도 9는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 438의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 10은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 438의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 11은 실시예 2에 기재된 실시예에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 438 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 12는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 457의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 13은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 457의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 14는 실시예 2에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 457 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 15는 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 활성 분획의 정량화에 대한 검정 결과의 그래프이다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다. "2"는 서열번호:2의 참조 CasX 단백질을 지칭한다.
도 16은 실시예 9에 기재된 CasX2(서열번호:2의 참조 CasX 단백질) 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다.
도 17은 실시예 9에 기재된 가이드-제한 조건 하에서 CasX 491 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 데이터의 2상 적합이 표시된다.
도 18은 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 단일 복제가 표시되는 488 및 491을 제외하고 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 19는 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 20은 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 초기 속도의 정량화를 나타낸다. 이전 절단 실험의 처음 2개 시점은 초기 절단 속도를 결정하기 위해 선형 모델로 피팅되었다.
도 21은 실시예 9에 기재된 CasX491 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 10℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 시점의 단상 적합이 표시된다.
도 22a-d는 실시예 10에 기재된 NTC PAM에 대한 CasX 변이체의 절단 속도의 정량화를 나타낸다. 동일한 스페이서 및 표시된 PAM 서열을 갖는 표적 DNA 기질을 37℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양은 표시된 시점에서 결정하였다. 단일 복제의 단상 적합이 표시된다. 도 22a는 TTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22b는 CTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22c는 GTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22d는 ATC PAM을 갖는 서열에 대한 결과를 나타낸다.
도 23은 실시예 13에 기재된 CasX, gNA, 및 슈도타입인 단백질을 포함하는 XDP의 생성에 활용된 플라스미드를 도시한다.
도 24는 실시예 13에 기재된 XDP의 생성에 사용하는 단계의 개략도이다.
도 25는 실시예 16에 기재된 dtTomato 분석의 편집 결과의 그래프이다.
도 26a는 실시예 17에 기재된 VSV-G의 일련의 농도로 슈도타입의 XDP를 갖는 마우스 tdTomato 신경 전구 세포(NPC)에서의 백분율 편집의 결과를 나타낸다.
도 26b는 실시예 17에 기재된 상업적으로 이용가능한 Lenti-X p24 ELISA 키트에 의해 측정된 XDP 역가를 나타낸다.
도 27은 실시예 17에 기재된 상이한 당단백질로 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집의 백분율을 나타낸다.
도 28a는 실시예 17에 기재된 VSV-G 슈도타입의 XDP(1X 및 10X 농축된 둘 모두), 광견병 슈도타입의 XDP 및 렌티바이러스(LV)의 크기 분포 및 바이러스 역가 비교의 결과를 나타낸다.
도 28b는 실시예 17에 기재된 VSV-G XDP, LV 및 광견병 XDP 간의 크기 비교를 나타낸다.
도 29는 실시예 18에 기재된 상이한 RNP를 담지하는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율의 결과를 나타낸다.
도 30은 실시예 19에 기재된 적정된 양의 Gag-Pol 대 Gag-Stx(Stx 작제물)를 갖는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율을 나타낸다.
도 31은 실시예 19에 기재된 다양한 양의 Gag-Pol 대 Gag-Stx 작제물을 갖는 이들 상이한 XDP에 대한 역가를 나타낸다.
도 32는 실시예 19에 기재된 QPCR에 의해 평가된 바와 같은 상이한 작제물에 대한 XDP 역가당 가이드 RNA의 양을 나타낸다.
도 33은 실시예 20에 기재된 2개의 상이한 B2M 표적화 스페이서 및 1개의 비표적화 스페이서를 함유하는 XDP에 의한 B2M의 상대적 녹아웃 비율의 결과를 나타낸다.
도 34는 실시예 14에 기재된 XDP 입자에 대한 원심분리 정제 공정 전반에 걸쳐 채취한 샘플의 대표적인 SDS-PAGE 및 웨스턴 블롯 이미지를 나타낸다.
도 35는 실시예 21에 기재된 버전 7, 버전 122 및 버전 123으로 구성된 XDP에 대한 편집 검정의 결과를 나타낸다.
도 36a는 버전 1 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 36b는 버전 2 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37a는 버전 3 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37b는 버전 4 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38a는 버전 5 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38b는 버전 6 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39a는 버전 7 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39b는 버전 8 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40a는 버전 9 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40b는 버전 10 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41a는 버전 11 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41b는 버전 12 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42a는 버전 13 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42b는 버전 14 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43a는 버전 15 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43b는 버전 16 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44a는 버전 24 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44b는 버전 25 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45a는 버전 26 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45b는 버전 27 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46a는 버전 31 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46b는 버전 32 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47a는 버전 33 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47b는 버전 34 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48a는 버전 35 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48b는 버전 36 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49a는 버전 37 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49b는 버전 38 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50a는 버전 39 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50b는 버전 40 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51a는 버전 17 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51b는 버전 18 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52a는 버전 44 및 45 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52b는 버전 46, 47, 62 및 90 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53a는 버전 48, 49 및 63 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53b는 버전 50 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54a는 버전 51 및 52 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54b는 버전 53, 54, 55 및 91 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55a는 버전 56-61 및 92 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55b는 버전 66a 및 67a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56a는 버전 66b 및 67b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56b는 버전 68a, 69a, 70a 및 87a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57a는 버전 68b, 69b, 70b 및 87b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57b는 버전 71a, 72a 및 88a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58a는 버전 71b, 72b 및 88b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58b는 버전 73a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59a는 버전 73b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59b는 버전 74a 및 75a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60a는 버전 74b 및 75b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60b는 버전 76a, 77a, 78a, 및 79a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61a는 버전 76b, 77b, 78b, 및 79b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61b는 버전 80a, 81a, 82a, 83a, 84a, 85a 및 86a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62a는 버전 80b, 81b, 82b, 83b, 84b, 85b, 및 86b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62b는 버전 102 및 114 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63a는 버전 103, 108, 및 109 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63b는 버전 104, 105, 115, 116 및 117 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64a는 버전 106, 111, 112, 83b 및 113 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64b는 버전 107 및 110 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 65는 버전 118 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66a는 버전 122 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66b는 버전 103 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67a는 버전 124 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67b는 버전 126 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 68은 버전 128 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 69a 및 69b는 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 70은 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 71a 및 71b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 72는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 73a 및 73b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 74는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 75a 및 75b는 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 76은 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 77은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 78은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
본 발명의 바람직한 실시형태가 본 명세서에 도시되고 기술되었지만, 그러한 실시형태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 발명을 벗어나지 않고 당업자에게 발생할 것이다. 본 명세서에 기재된 발명의 실시형태에 대한 다양한 대안이 발명을 실시하는데 이용될 수 있음이 이해되어야 한다. 다음 청구범위는 발명의 범주를 정의하고 이들 청구범위 및 그 균등물의 범주 내의 방법 및 구조는 이에 의해 커버되는 것으로 의도된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상인에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 등가인 방법 및 물질이 본 실시형태의 실시 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 아래에 기술된다. 충돌하는 경우 정의를 포함한 특허 명세서가 우선한다. 부가하여, 물질, 방법 및 실시예는 예시일 뿐이며 제한하려는 의도가 아니다. 수많은 변형, 변경 및 대체가 이제 발명을 벗어나지 않고 기술 분야에서 통상인에게 발생할 것이다.
정의
본 명세서에서 상호교환가능하게 사용되는 용어 "폴리뉴클레오티드" 및 "핵산"은 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 중 어느 하나의 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭한다. 따라서, 용어 "폴리뉴클레오티드" 및 "핵산"은 단일-가닥 DNA; 이중-가닥 DNA; 다중-가닥 DNA; 단일-가닥 RNA; 이중-가닥 RNA; 다중-가닥 RNA; 게놈 DNA; cDNA; DNA-RNA 하이브리드; 및 퓨린 및 피리미딘 염기 또는 기타 천연, 화학적 또는 생화학적으로 변형된, 비-천연 또는 유도체화된 뉴클레오티드 염기를 포함하는 중합체를 포괄한다.
"혼성화가능한" 또는 "상보적인"은 핵산(예를 들어, RNA, DNA)이 비-공유적으로 결합, 즉 Watson-Crick 염기쌍 및/또는 G/U 염기쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에서 서열-특이적, 역평행 방식으로 또 다른 핵산에 "어닐링" 또는 "하이브리드화" (즉, 핵산이 상보적 핵산에 특이적으로 결합함)할 수 있게 하는 뉴클레오티드의 서열을 포함한다는 것을 의미하기 위해 상호교환적으로 사용된다. 폴리뉴클레오티드의 서열은 특이적으로 혼성화가능할 수 있는 그 표적 핵산의 서열에 100% 상보적일 필요는 없는 것으로 이해되며; 이것은 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95% 서열 동일성을 가질 수 있고 여전히 표적 핵산에 혼성화가능하다. 더욱이, 폴리뉴클레오티드는 개재하는 또는 인접한 세그먼트가 혼성화 이벤트(예를 들어, 고리 구조 또는 헤어핀 구조, '벌지', '버블' 등)에 관여하지 않도록 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있다.
본 개시내용의 목적을 위한 "유전자"는 유전자 생성물(예를 들어, 단백질, RNA)을 인코딩하는 DNA 영역 뿐만 아니라, 그러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하든 하지 않든, 유전자 생성물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터, 번역 조절 서열 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일런서, 절연체, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 좌위 제어 영역을 포함하지만 이에 필수적으로 제한되지 않는 조절 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사 및 번역 시 유전자 산물을 인코딩하며; 개시내용의 코딩 서열은 단편을 포함할 수 있고 전장 개방 판독 프레임을 함유할 필요는 없다. 유전자는 전사되는 가닥뿐만 아니라 안티코돈을 함유하는 상보적 가닥 둘 모두를 포함할 수 있다.
용어 "다운스트림"는 참조 뉴클레오티드 서열의 3'에 위치한 뉴클레오티드 서열을 지칭한다. 특정 실시형태에서, 다운스트림 뉴클레오티드 서열은 전사의 시작점을 따르는 서열에 관한 것이다. 예를 들어, 유전자의 번역 개시 코돈은 전사의 시작 부위의 다운스트림에 위치한다.
용어 "업스트림"는 참조 뉴클레오티드 서열의 5'에 위치한 뉴클레오티드 서열을 지칭한다. 특정 실시형태에서, 업스트림 뉴클레오티드 서열은 코딩 영역 또는 전사의 시작점의 5' 측에 위치하는 서열에 관한 것이다. 예를 들어, 대부분의 프로모터는 전사의 시작 부위의 업스트림에 위치한다.
용어 "조절 요소"는 본 명세서에서 용어 "조절 서열"과 상호교환적으로 사용되고, 프로모터, 인핸서 및 기타 발현 조절 요소(예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 예시적인 조절 요소는 전사 프로모터 예컨대, 이에 제한되지는 않지만, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, 신장 인자 1 알파(EF1α), MMLV-ltr, 내부 리보솜 진입 부위(IRES) 또는 단일 전사체로부터 다중 유전자의 번역을 허용하는 P2A 펩티드, 메탈로티오네인, 전사 인핸서 요소, 전사 종결 신호, 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 엑손 스키핑에 이용되는 시스템의 경우, 조절 요소는 엑손 스플라이싱 인핸서를 포함한다. 적절한 조절 요소의 선택은 발현되어 지는 인코딩된 성분(예를 들어, 단백질 또는 RNA) 또는 핵산이 상이한 폴리머라제를 필요로 하거나 융합 단백질로 발현되도록 의도되지 않은 다중 성분을 포함하는지 여부에 의존할 것이다는 것이 이해될 것이다.
용어 "프로모터"는 RNA 폴리머라제 결합 부위, 전사 시작 부위, TATA 박스, 및/또는 B 인식 요소를 함유하고 연관된 전사가능한 폴리뉴클레오티드 서열 및/또는 유전자(또는 이식유전자)의 전사 및 발현을 보조하거나 촉진하는 DNA 서열을 지칭한다. 프로모터는 합성적으로 생성될 수 있거나 공지된 또는 자연적으로 발생하는 프로모터 서열 또는 또 다른 프로모터 서열로부터 유래될 수 있다. 프로모터는 전사되어 지는 유전자의 근위 또는 원위일 수 있다. 프로모터는 또한 특정 특성을 부여하기 위해 2개 이상의 이종성 서열의 조합을 포함하는 키메라 프로모터를 포함할 수 있다. 본 개시내용의 프로모터는 조성이 유사하지만 본 명세서에 공지되거나 제공된 다른 프로모터 서열(들)과 동일하지 않은 프로모터 서열의 변이체를 포함할 수 있다. 프로모터는 구성적, 발달적, 조직-특이적, 유도성 등과 같이 프로모터에 작동가능하게 연결된 연관된 코딩 또는 전사가능한 서열 또는 유전자의 발현의 패턴과 관련된 기준에 따라 분류될 수 있다.
용어 "인핸서"는 전사 인자라고 하는 특정 단백질에 의해 결합될 때 연관된 유전자의 발현을 조절하는 조절 DNA 서열을 지칭한다. 인핸서는 유전자의 인트론, 또는 유전자의 코딩 서열의 5' 또는 3'에 위치할 수 있다. 인핸서는 유전자에 근접하거나(, 프로모터의 수십 또는 수백의 염기쌍(bp) 내), 유전자에서 원위에 위치할 수 있다(, 프로모터로부터 수천 bp, 수십만 bp 또는 심지어 수백만 bp 떨어져 있음). 단일 유전자는 하나 초과의 인핸서에 의해 조절될 수 있으며, 이들 모두는 본 개시내용의 범주 내인 것으로 고려된다.
본 명세서에 사용된 "재조합"은 특정 핵산(DNA 또는 RNA)이 자연계에서 발견되는 내인성 핵산과 구별가능한 구조적 코딩 또는 비-코딩 서열을 갖는 작제물을 생성하는 클로닝, 제한 및/또는 결찰 단계의 다양한 조합의 산물임을 의미한다. 일반적으로, 구조적 코딩 서열을 인코딩하는 DNA 서열은 cDNA 단편 및 짧은 올리고뉴클레오티드 링커, 또는 일련의 합성 올리고뉴클레오티드로부터 어셈블링되어 세포 또는 세포-유리 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 이러한 서열은 전형적으로 진핵생물 유전자에 존재하는 내부 비-번역된 서열, 또는 인트론에 의해 중단되지 않는 개방 판독 프레임의 형태로 제공될 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역된 DNA의 서열은 개방 판독 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 여기서 그러한 서열은 코딩 영역의 조작 또는 발현을 방해하지 않으며 실제로 다양한 메커니즘에 의해 원하는 생성물의 생산을 조절하는 작용을 할 수 있다(상기의 "인핸서" 및 "프로모터" 참고).
용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산"은 자연적으로 발생하지 않는 것, 예를 들어 인간 개입을 통해 2개의 달리 분리된 서열 세그먼트의 인공적 조합에 의해 만들어진 것을 지칭한다. 이 인공적 조합은 종종 화학적 합성 수단에 의해 또는 예를 들어 유전 공학 기술에 의해 단리된 핵산 세그먼트의 인공적 조작에 의해 달성된다. 이는 전형적으로 서열 인식 부위를 도입하거나 제거하면서 동일하거나 보존적 아미노산을 인코딩하는 중복 코돈으로 코돈을 대체하기 위해 일반적으로 수행된다. 대안적으로, 그것은 원하는 기능의 조합을 생성하기 위해 원하는 기능의 핵산 세그먼트를 함께 결합하기 위해 수행된다. 이 인공적 조합은 종종 화학적 합성 수단에 의해 또는 예를 들어 유전 공학 기술에 의해 단리된 핵산 세그먼트의 인공적 조작에 의해 달성된다.
유사하게, 용어 "재조합 폴리펩티드" 또는 "재조합 단백질"은 자연적으로 발생하지 않는, 예를 들어 인간 개입을 통해 2개의 달리 분리된 아미노 서열 세그먼트의 인공적 조합에 의해 만들어진 폴리펩티드 또는 단백질을 지칭한다. 따라서, 예를 들어, 이종성 아미노산 서열을 포함하는 단백질은 재조합이다.
본 명세서에 사용된, 용어 "접촉하는"은 둘 이상의 엔티티 사이에 물리적 연결을 설정하는 것을 의미한다. 예를 들어, 표적 핵산을 가이드 핵산과 접촉시키는 것은 표적 핵산과 가이드 핵산이 물리적 연결을 공유하도록 만드는 것; 예를 들어, 서열이 서열 유사성을 공유한다면 혼성화할 수 있는 것을 의미한다.
"해리 상수" 또는 "Kd"는 상호교환적으로 사용되고 리간드 "L"과 단백질 "P" 사이의 친화도; 즉, 리간드가 특정 단백질에 얼마나 단단히 결합하는지를 의미한다. 그것은 공식 Kd=[L][P]/[LP]를 사용하여 계산할 수 있으며, 여기서 [P], [L] 및 [LP]는 각각 단백질, 리간드 및 복합체의 몰 농도를 나타낸다.
개시내용은 표적 핵산을 변형하는데 유용한 조성물 및 방법을 제공한다. 본 명세서에 사용된 "변형"은 절단, 닉킹, 편집, 결실, 녹인, 녹아웃 등을 포함하지만 이에 제한되지 않는다.
용어 "녹-아웃"은 유전자의 제거 또는 유전자의 발현을 지칭한다. 예를 들어, 유전자는 판독 프레임의 붕괴를 초래하는 뉴클레오티드 서열의 결실 또는 추가에 의해 녹아웃될 수 있다. 또 다른 예로서, 유전자는 유전자의 일부를 관련 없는 서열로 대체함에 의해 녹아웃될 수 있다. 본 명세서에 사용된 용어 "녹-다운"은 유전자의 발현 또는 이의 유전자 생성물(들)에서 감소를 지칭한다. 유전자 녹-다운의 결과로 단백질 활성 또는 기능이 약화되거나 단백질 수준이 감소 또는 제거될 수 있다.
본 명세서에 사용된 "상동성-지향된 복구"(HDR)는 세포에서 이중-가닥 파손의 복구 동안 발생하는 DNA 복구의 형태를 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 요하고, 공여자 주형을 사용하여 표적 DNA를 복구하거나 녹-아웃시키고, 공여자로부터 표적으로 유전 정보의 전달을 야기한다. 상동성-지향된 복구는 공여자 주형이 표적 DNA 서열과 다르고 공여자 주형의 서열의 일부 또는 전부가 표적 DNA 안으로 통합되는 경우 삽입, 결실 또는 돌연변이에 의해 표적 서열의 서열 변경을 초래할 수 있다.
본 명세서에 사용된 "비-상동성 말단 연결"(NHEJ)은 (가이드 복구를 위해 상동성 서열을 요하는, 상동성-지향된 복구에 대비하여) 상동성 주형이 필요 없이 파손 말단을 서로 직접 결찰에 의해 DNA에서 이중-가닥 파손의 복구를 지칭한다. NHEJ는 종종 이중-가닥 파손의 부위 근처의 뉴클레오티드 서열의 손실(결실)을 초래한다.
본 명세서에 사용된 "마이크로-상동성 매개된 말단 연결"(MMEJ)은 (가이드 복구를 위해 상동성 서열을 요하는, 상동성-지향된 복구에 대비하여) 상동성 주형이 필요 없이 파손 부위를 측접하는 결실과 항상 연관되는, 돌연변이유발 DSB 복구 메커니즘을 지칭한다. MMEJ는 종종 이중-가닥 파손의 부위 근처의 뉴클레오티드 서열의 손실(결실)을 초래한다. 폴리뉴클레오티드 또는 폴리펩티드는 다른 폴리뉴클레오티드 또는 폴리펩티드와 특정 퍼센트 "서열 유사성" 또는 "서열 동일성"을 가지며, 이는 정렬될 때 염기 또는 아미노산의 백분율이 동일하고 두 서열을 비교할 때 동일한 상대적 위치에 있음을 의미한다. 서열 유사성 (때때로 퍼센트 유사성, 퍼센트 동일성 또는 상동성으로 지칭됨)은 다수의 상이한 방식으로 결정될 수 있다. 서열 유사성을 결정하기 위해, 서열은 ncbi.nlm.nih.gov/BLAST에서의 월드 와이드 웹에서 입수가능한 BLAST를 포함하여, 당업계에 공지된 방법 및 컴퓨터 프로그램을 사용하여 정렬될 수 있다. 핵산 내 핵산 서열의 특정 스트레치 간의 퍼센트 상보성은 임의의 편리한 방법을 사용하여 결정될 수 있다. 예시적 방법은 BLAST 프로그램(베이직 로컬 정렬 검색 도구) 및 PowerBLAST 프로그램(Altschul 등, J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656)을 포함하거나 또는 Gap 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)를 사용하는 것, 예를 들어 Smith와 Waterman의 알고리즘(Adv. Appl. Math., 1981, 2, 482-489)을 사용하는 기본 설정을 사용하는 것을 포함한다.
용어 "폴리펩티드" 및 "단백질"은 본 명세서에서 상호교환적으로 사용되고, 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산 및 변형된 펩티드 골격을 갖는 폴리펩티드를 포함할 수 있는, 임의의 길이의 아미노산의 중합체 형태를 지칭한다. 용어는 이종성 아미노산 서열을 갖는 융합 단백질을 포함하지만 이에 제한되지 않는 융합 단백질을 포함한다.
"벡터" 또는 "발현 벡터"는, 세포에서 부착된 세그먼트의 복제 또는 발현을 일으키기 위해 다른 DNA 세그먼트, 즉 "삽입물"이 부착될 수 있는 플라스미드, 파지, 바이러스 또는 코스미드와 같은 레플리콘이다.
핵산, 폴리펩티드, 세포 또는 유기체에 적용되는 본 명세서에서 사용된 용어 "자연적으로-발생하는" 또는 "비변형된" 또는 "야생형"은 자연에서 발견되는 핵산, 폴리펩티드, 세포, 또는 유기체를 지칭한다.
본 명세서에 사용된 "돌연변이"는 야생형 또는 참조 아미노산 서열 또는 야생형 또는 참조 뉴클레오티드 서열과 비교하여 하나 이상의 아미노산 또는 뉴클레오티드의 삽입, 결실, 치환, 중복 또는 역전을 지칭한다.
본 명세서에 사용된 용어 "단리된"은 폴리뉴클레오티드, 폴리펩티드 또는 세포가 자연적으로 발생하는 환경과 상이한 환경에 있는 폴리뉴클레오티드, 폴리펩티드 또는 세포를 기술하기 위한 것으로 의미된다. 단리된 유전적으로 변형된 숙주 세포는 유전적으로 변형된 숙주 세포의 혼합된 모집단에 존재할 수 있다.
본 명세서에 사용된 "숙주 세포"는 진핵 세포, 원핵 세포 또는 단세포 엔티티로서 배양된 다세포 유기체(예를 들어, 세포주)로부터의 세포를 나타내며, 진핵 또는 원핵 세포는 핵산(예를 들어, 발현 벡터)에 대한 수용체로서 사용되고 핵산에 의해 유전적으로 변형된 원래 세포의 자손을 포함한다. 단일 세포의 자손은 자연적, 우발적 또는 고의적 돌연변이로 인해 형태나 게놈 또는 전체 DNA 보체에서 원래의 모체와 반드시 완전히 동일하지 않을 수 있음을 이해한다. "재조합 숙주 세포"("유전적으로 변형된 숙주 세포"로도 지칭됨)는 이종성 핵산, 예를 들어 발현 벡터가 그 안으로 도입된 숙주 세포이다.
본 명세서에 사용된 용어 "향성"은 특정 세포 또는 조직 유형(들) 안으로의 XDP의 우선적 도입 및/또는 특정 세포 또는 조직 유형 안으로의 도입을 용이하게 하는 세포 표면과의 우선적 상호작용을 지칭하며, 선택적으로 및 바람직하게는 XDP에 의해 세포 안으로 운반되는 서열의 발현(예를 들어, 전사 및 선택적으로 번역)이 이어진다.
본 명세서에 사용된 용어 "슈도타입" 또는 "슈도타입인"은 바람직한 특성을 보유하는 다른 바이러스의 것으로 치환된 바이러스 외피 단백질을 지칭한다. 예를 들어, HIV는 수포성 구내염 바이러스 G-단백질(VSV-G) 외피 단백질(다른 것들 중에서, 아래에 기술됨)로 슈도타입될 수 있으며, 이는 HIV 외피 단백질이 주로 CD4+ 제시 세포를 표적화하기 때문에 HIV가 더 넓은 범위의 세포를 감염시킬 수 있다.
본 명세서에 사용된 용어 "향성 인자"는 특정 세포 또는 조직 유형에 대해 향성을 제공하는 XDP의 표면 안으로 통합된 성분을 지칭한다. 향성 인자의 비-제한적 예는 당단백질, 항체 단편(예를 들어, scFv, 나노바디, 선형 항체 등), 표적 세포 마커에 대한 수용체 및 리간드를 포함한다.
"표적 세포 마커"는 향성 인자에 대한 리간드로 작용할 수 있는 표적 조직 또는 세포의 표면에 존재할 수 있는 세포-표면 수용체, 사이토카인 수용체, 항원, 종양-연관된 항원, 당단백질, 올리고뉴클레오티드, 효소 기질, 항원 결정자 또는 결합 부위를 포함하지만 이에 제한되지 않는 표적 세포에 의해 발현되는 분자를 지칭한다.
"항체 단편"은 온전한 항체의 일부를 포함하고 온전한 항체가 결합하는 항원에 결합하는 온전한 항체 이외의 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')2, 디아바디, 단일 사슬 디아바디, 선형 항체, 단일 도메인 항체, 단일 도메인 낙타류 항체, 단일-사슬 가변 단편(scFv) 항체 분자, 및 항체 단편으로부터 형성된 다중특이적 항체를 포함하지만 이에 제한되지 않는다.
용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질에서의 상호교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신으로 구성되며; 지방족-하이드록실 측쇄를 갖는 아미노산의 그룹은 세린 및 트레오닌으로 구성되며; 아미드-함유 측쇄를 갖는 아미노산의 그룹은 아스파라긴 및 글루타민으로 구성되며; 방향족 측쇄를 갖는 아미노산의 그룹은 페닐알라닌, 티로신 및 트립토판으로 구성되며; 염기성 측쇄를 갖는 아미노산의 그룹은 라이신, 아르기닌 및 히스티딘으로 구성되며; 황-함유 측쇄를 갖는 아미노산의 그룹은 시스테인 및 메티오닌으로 구성된다. 예시적인 보존적 아미노산 치환기는 발린-류신-이소류신, 페닐알라닌-티로신, 라이신-아르기닌, 알라닌-발린, 및 아스파라긴-글루타민이다.
본 명세서에 사용된 "치료" 또는 "치료하는"은 본 명세서에서 상호교환적으로 사용되고, 치료적 이점 및/또는 예방적 이점을 포함하지만 이에 제한되지 않는 유익한 또는 원하는 결과를 얻기 위한 접근법을 지칭한다. 치료적 이점은 치료되는 근본적인 장애 또는 질환의 근절 또는 개선을 의미한다. 치료적 이점은 대상체가 여전히 기저 장애를 앓고 있을 수 있음에도 불구하고 대상체에서 개선이 관찰되도록 하나 이상의 증상의 근절 또는 개선 또는 기저 질환과 연관된 하나 이상의 임상적 매개변수의 개선으로 달성될 수 있다.
본 명세서에 사용된 용어 "치료적으로 유효한 양" 및 "치료적으로 유효한 용량"은 인간 또는 실험 동물과 같은 대상체에게 1회 또는 반복 용량으로 투여될 때 질환 상태 또는 병태의 임의의 증상, 양상, 측정된 매개변수 또는 특성에 대한 임의의 검출가능한 유익한 효과를 가질 수 있는 단독으로 또는 조성물의 일부로서 약물 또는 생물학적 제제의 양을 지칭한다. 그러한 효과가 반드시 유익할 필요는 없다.
본 명세서에 사용된 "투여"는 화합물(예를 들어, 개시내용의 조성물) 또는 조성물(예를 들어, 약학적 조성물)의 투여량을 대상체에게 제공하는 방법을 의미한다.
"대상체"는 포유동물이다. 포유동물은 가축, 비-인간 영장류, 인간, 개, 토끼, 마우스, 랫트 및 기타 설치류를 포함하지만 이에 제한되지는 않는다.
I. 일반적인 방법
본 발명의 실행은 달리 지시되지 않는 한, 그 개시내용이 참고로 본 명세서에 포함된, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook 등, Cold Spring Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel 등 eds., John Wiley & Sons 1999); Protein Methods (Bollag 등, John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner 등 eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997); 및 Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)와 같은 표준 교과서에서 찾아볼 수 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈 및 재조합 DNA의 통상적인 기술을 이용한다.
값의 범위가 제공되는 경우, 문맥이 명백하게 달리 지시하지 않는 한, 종점이 포함되고 그 범위의 상한과 하한 사이에서 하한 단위의 10분의 1까지 각각의 중간 값 및 그 명시된 범위에서 임의의 다른 명시된 또는 중간 값이 포괄된다는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 더 작은 범위에 독립적으로 포함될 수 있고 또한 언급된 범위에서 구체적으로 배제된 제한에 따라 포괄된다. 명시된 범위가 제한 중 하나 또는 둘 모두를 포함하는 경우, 이들 포함된 제한 중 어느 하나 또는 둘 모두를 제외한 범위도 포함된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상인에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 언급된 모든 간행물은 그 간행물이 인용된 것과 관련된 방법 및/또는 물질을 개시하고 기술하기 위해 참고로 본 명세서에 포함된다.
본 명세서 및 첨부된 청구범위에서 사용된, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수의 지시대상을 포함한다는 점에 유의해야 한다.
명료함을 위해 별도 실시형태의 맥락에서 기술된 개시내용의 특정 특징은 단일 실시형태에서 조합되어 제공될 수도 있다는 것을 이해할 것이다. 다른 경우에, 간결함을 위해 단일 실시형태의 맥락에서 기술되는 개시내용의 다양한 특징은 또한 별도로 또는 임의의 적절한 하위-조합으로 제공될 수 있다. 개시내용에 속하는 실시형태의 모든 조합은 본 개시내용에 의해 구체적으로 포괄되고, 마치 각각 및 모든 조합이 개별적으로 그리고 명시적으로 개시되어 있는 것처럼 본 명세서에 개시되는 것으로 의도된다. 부가하여, 다양한 실시형태 및 그 요소의 모든 하위-조합이 또한 본 개시내용에 의해 구체적으로 포괄되고, 마치 각각 및 모든 그러한 하위-조합이 개별적으로 그리고 명시적으로 본 명세서에 개시되어 있는 것처럼 본 명세서에 개시된다.
II. 표적 세포에 사용하기 위한 입자 전달 시스템
제1 양태에서, 본 개시내용은 치료 페이로드를 포함하는 입자를 자가-어셈블링하도록 설계된 입자 전달 시스템(XDP)에 관한 것으로 여기서 입자는 표적화된 세포로의 선택적 전달을 위해 설계된다. 본 명세서에 사용된 용어 "XDP"는 하나 이상의 바이러스 단백질, 폴리단백질, 바이러스로-유래된 펩티드 또는 폴리펩티드, 예컨대 비제한적으로, 캡시드, 코트, 껍질 뿐만 아니라 향성 인자 예컨대 바이러스로부터 유래된 외피 당단백질, 항체 단편, (숙주 세포에서 유래된) 지질층과 함께 표적 세포 또는 조직으로 XDP를 지향시키기 위한 향성을 위해 이용된 수용체 또는 리간드로 구성된 비-복제, 자가-어셈블리, 비-자연적으로 발생하는 다성분 구조를 지칭하며, 여기서 XDP는 숙주 세포에서 자가-어셈블리가 가능하고 치료 페이로드를 캡슐화하거나 포함할 수 있다. 본 개시내용의 XDP는 표적 세포 또는 조직에 치료 페이로드를 특이적이고 선택적으로 전달하기 위해 이용될 수 있다. 개시내용의 XDP는 질환의 치료를 위해 표적 세포 또는 기관에 선택적인 양식으로 치료제를 전달하는데 있어서의 용도를 포함하지만 이에 제한되지 않는 다양한 방법에서 유용성을 갖는다.
일부 실시형태에서, 본 개시내용은 XDP의 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산, 치료 페이로드, 및 적절한 진핵 숙주 세포 내로 도입될 때 치료 페이로드를 캡슐화하고 본 명세서에 기재된 방법 및 용도를 위해 수집 및 정제될 수 있는 XDP 입자 안으로 자가-어셈블리되는 개별 XDP 구조 성분, 처리 단백질, 치료 페이로드 및 향성 인자의 발현을 초래하는 향성 인자를 포함하는 XDP 시스템을 제공한다.
일부 실시형태에서, XDP 내에 패키징된 치료 페이로드는 하기에 보다 완전하게 기재된 치료 단백질을 포함한다. 다른 실시형태에서, XDP 내에 패키징된 치료 페이로드는 치료 핵산 또는 치료 단백질을 인코딩하는 핵산을 포함한다. 또 다른 실시형태에서, XDP는 치료 단백질 및 핵산을 포함한다. 일부 경우에, 치료 페이로드는 표적 세포에서 핵산의 편집에 유용한 CRISPR 뉴클레아제 및 가이드 RNA 또는 징크 핑거 단백질과 같은 유전자 편집 시스템을 포함한다. 일부 실시형태에서, 치료 페이로드는 클래스 2 CRISPR-Cas 시스템을 포함한다. 클래스 2 시스템은 단일 다중-도메인 이펙터 단백질을 가지고, 참고로 본 명세서에 포함된 Makarova, 등 Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants. Nature Rev. Microbiol. 18:67 (2020)에 기술된, 유형 II, 유형 V 또는 유형 VI 시스템으로 더 분할된다는 점에서 클래스 1 시스템과 구별된다. 일부 실시형태에서, 뉴클레아제는 클래스 2, 유형 II CRISPR/Cas 이펙터 폴리펩티드 예컨대 Cas9를 포함한다. 다른 경우에, 뉴클레아제는 클래스 2, 유형 V CRISPR/Cas 이펙터 폴리펩티드 예컨대 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12J 및 CasX를 포함하며, 여기서 CRISPR 뉴클레아제 및 가이드 시스템은 다음 중 하나 이상을 수행할 수 있다: (i) 표적 ssDNA, dsDNA 또는 RNA를 변형(예를 들어, 편집) (예를 들어, 절단, 닉 또는 메틸화); (ii) 표적 핵산의 전사를 조절; (iii) 표적 핵산에 결합(예를 들어, 단리, 전사 차단, 라벨링 또는 영상화 등의 목적); 또는 (v) 표적 핵산과 연관된 폴리펩티드를 변형. 특정 실시형태에서, 본 개시내용은 아래에서 더 자세히 기술된, 표적 세포 내 핵산의 편집에 유용한 CasX 및 가이드 RNA 시스템(CasX:gNA 시스템)을 포함하는 리보핵산 입자(RNP)를 패키징하도록 설계된 XDP 조성물, 및 XDP 조성물을 제조하는 방법을 제공한다. 따라서, 본 개시내용은 XDP 조성물, XDP의 성분(구조적 뿐만 아니라 유전자-편집 성분 둘 모두)을 인코딩하는 핵산, 뿐만 아니라 XDP를 제조하고 사용하는 방법을 제공한다. 핵산, 조성물의 성분, 및 이들을 제조하고 사용하는 방법은 하기 본 명세서에 기재되어 있다.
a. XDP 성분
XDP는 다양한 소스 및 다른 조합에서 유래된 성분을 활용하여 다중 형태 및 구성(예를 들어, 도 36-68 참조)으로 생성될 수 있다.
본 개시내용의 XDP의 구조적 성분은 하기에 보다 완전하게 기술되는 레트로바이러스과 바이러스 패밀리의 구성원으로부터 유래된다. 레트로바이러스의 주요 구조적 성분은 전형적으로 바이러스 프로테아제에 의한 작용에 따라 Gag를, 공급원 바이러스의 복제의 경우 그 다음 숙주 세포에서 자가-어셈블리되어 바이러스의 코어 내부 껍질을 만드는 하위 성분으로 처리하는 프로테아제 절단 부위를 함유하는 폴리단백질 Gag이다. Gag의 발현만으로도 숙주 세포에서 바이러스-유사 입자(VLP)의 어셈블리 및 방출을 매개하기에 충분하다. 모든 레트로바이러스의 Gag 단백질은 레트로바이러스 속 전체에 걸쳐 구조적으로 유사하지만 서열에서 크게 다른 N-말단 막-결합 매트릭스(MA) 도메인, 캡시드(CA) 도메인(2개의 서브도메인을 가짐) 및 뉴클레오캡시드(NC) 도메인을 함유한다. 이들 코어 도메인 외부에서 Gag 단백질은 레트로바이러스에 따라 다르고 다른 링커 및 도메인이 존재할 수 있다(Shur, F., 등 The Structure of Immature Virus-Like Rous Sarcoma Virus Gag Particles Reveals a Structural Role for the p10 Domain in Assembly. J Virol. 89(20):10294 (2015)). 숙주 세포에서 미성숙 입자로 Gag의 어셈블리 경로는 MA(Gag 폴리단백질을 원형질막으로 표적화하는 역할을 함) 사이, NC와 RNA 사이, CA 도메인(본 개시내용의 맥락에서, XDP 캡시드로 어셈블리됨) 사이의 상호작용에 의해 매개된다. 대부분의 레트로바이러스 속의 경우 어셈블리는 원형질막에서 일어나지만 베타레트로바이러스의 경우 입자가 세포질에서 어셈블리된 다음 원형질막으로 운반된다. 레트로바이러스의 맥락에서, 입자 방출과 동시에 또는 직후에 바이러스 프로테아제(PR)에 의한 Gag의 절단은 MA, CA 및 NC 단백질을 분리하여, 성숙한 바이러스 코어의 껍질을 형성하는 CA와 함께 내부 바이러스 구조의 재배열을 유도한다. 그 개개의 도메인 안으로 Gag의 완전한 단백질분해 절단은 고유 바이러스에 대한 바이러스 감염성을 위해 필요하다. 그러나, 표적 세포에 의해 흡수되고 활성 치료 페이로드를 전달할 수 있는 레트로바이러스 성분을 포함하는 숙주 세포 내의 XDP의 자가-어셈블리을 위해 XDP는 일부 구성 실시형태에서 Gag의 절단을 필요로 하지 않고; 따라서 프로테아제 및 절단 부위의 생략은 실시예를 포함하여 하기에 보다 완전하게 기재된 일부 실시형태에서 없어도 된다는 것이 발견되었다.
일부 실시형태에서, 본 개시내용은 레트로바이러스과 바이러스, 치료 페이로드(아래에서 보다 완전하게 기술됨), 및 향성 인자(아래에서 보다 완전하게 기술됨)로부터 유래된 하나 이상의 구조적 구성요소를 포함하는 XDP를 제공한다. 일부 실시형태에서, 바이러스 구조적 성분은 오르소레트로바이러스아과 바이러스로부터 유래된다. 일부 실시형태에서, 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 또는 렌티바이러스이다. 다른 실시형태에서, 바이러스 구조적 성분은 스푸마레트로바이러스아과 바이러스로부터 유래된다. 일부 실시형태에서, 스푸마레트로바이러스아과 바이러스는 보바스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스 또는 시미스푸마바이러스이다.
b. 레트로바이러스 성분
레트로바이러스과 바이러스 패밀리는 오르소레트로바이러스아과, 스푸마레트로바이러스아과 및 미분류된 레트로바이러스과를 포함하여 상이한 서브패밀리를 갖는다. 많은 레트로바이러스는 인간, 기타 포유동물 및 새에서 심각한 질환을 야기한다. 인간 레트로바이러스는 AIDS 질환의 원인인 인간 면역결핍 바이러스 1(HIV-1) 및 HIV-2를 포함하고, 인간 T-림프영향성 바이러스(HTLV)도 또한 인간에서 질환을 야기한다. 서브패밀리 오르소레트로바이러스아과알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스렌티바이러스 속을 포함한다. 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함한 알파레트로바이러스의 구성원은 야생 및 가금류의 육종, 종양 및 빈혈을 야기할 수 있다. 베타레트로바이러스의 예는 마우스 유선 종양 바이러스, 메이슨-화이자 원숭이 바이러스 및 동물성 비강 종양 바이러스를 포함한다. 델타레트로바이러스의 예는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함한다. 엡실론레트로바이러스의 구성원은 Walleye 피부 육종 바이러스, 및 Walleye 표피 증식증 바이러스 1 및 2를 포함한다. 감마레트로바이러스의 구성원은 뮤어라인 백혈병 바이러스, Maloney 뮤어라인 백혈병 바이러스, 및 고양이 백혈병 바이러스 뿐만 아니라 다른 동물 종을 감염시키는 바이러스를 포함한다. 렌티바이러스는 AIDS의 원인인 HIV-1과 HIV-2를 포함하여 만성적이고 치명적인 질환을 일으키는 레트로바이러스의 속이고, 유인원 면역결핍 바이러스를 또한 포함한다. 서브패밀리 스푸마레트로바이러스아과보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스 속을 포함한다. 레트로바이러스과의 구성원은 분자 생물학에서 가치있는 연구 도구를 제공했으며, 본 개시내용의 맥락에서 전달 시스템을 위한 XDP의 생성에 사용되었다. XDP의 레트로바이러스-유래된 구조적 성분은 레트로바이러스과의 각각의 속에서 유래될 수 있으며 생성된 XDP는 숙주 세포에서 자가-어셈블리가 가능하고 표적 세포 및 조직에 치료 페이로드의 표적화되고 선택적인 전달에서 유용성을 갖는 치료 페이로드를 캡슐화(또는 포괄)할 수 있다는 것이 발견되었다.
일부 실시형태에서, XDP 레트로바이러스 성분은 조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV)를 포함하지만 이에 제한되지 않는 알파레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p2A 스페이서 펩티드; ap2B 스페이서 펩티드; p10 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2A, p2B, p10, 뉴클레오캡시드 폴리펩티드(NC)를 함유하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, p2A, p2B, p10, 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 비제한적으로 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함하는 알파레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 알파레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 알파레트로바이러스 구조 성분을 포함한다. 알파레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 위에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 마우스 유방 종양 바이러스(MMTV), 메이슨-화이자 원숭이 바이러스(MPMV) 및 동물성 비강 종양 바이러스(ENTV)를 포함하지만 이에 제한되지 않는 베타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp21/24 스페이서 펩티드; p3-p8/p12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), pp21/24, p3-p8/p12, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, pp2124 스페이서, p3-p8/p12 스페이서, 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 비제한적으로 마우스 유방 종양 바이러스, 메이슨-화이자 원숭이 바이러스, 및 동물성 비강 종양 바이러스를 포함하는 베타레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 235-257로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 베타레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 235-257로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 베타레트로바이러스 구조 성분을 포함한다. 베타레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 소 백혈병 바이러스(BLV) 및 인간 T-림프영양성 바이러스(HTLV1)를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 258-272로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 델타레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 258-272로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 델타레트로바이러스 구조 성분을 포함한다. 델타레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 Walleye 피부 육종 바이러스(WDSV), 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p20 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p20, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기술되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 273-277로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 엡실론레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 273-277로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 엡실론레트로바이러스 구조 성분을 포함한다. 엡실론레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 뮤어라인 백혈병 바이러스(MLV), 말로니 뮤어라인 백혈병 바이러스(MMLV) 및 고양이 백혈병 바이러스(FLV)를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), pp12 스페이서, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, pp12, CA 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기술되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 278-287로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 감마레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 278-287로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 감마레트로바이러스 구조 성분을 포함한다. 감마레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 HIV-1 및 HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드(CA), p2 스페이서 펩티드, 뉴클레오캡시드(NC), p1/p6 스페이서 펩티드; ); 매트릭스 폴리펩티드(MA), CA, p2, NC 및 p1/p6을 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, NC, 및 p1/p6), 및 선택적으로 절단 부위 및 프로테아제는 HIV-1, HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 288-312 및 334-339로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 렌티바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 288-312 및 334-339로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 렌티바이러스 구조 성분을 포함한다. 렌티바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개 이상의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 그러한 경우에, 본 개시내용은 XDP를 제공하며 여기서 XDP는 p68 Gag; p3 Gag; p68 Gag 및 p3 gag를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, p68 및 p3p20), 및 선택적으로 절단 부위 및 프로테아제는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 313-333으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 스푸마레트로바이러스아과 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 313-333으로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 스푸마레트로바이러스아과 구조 성분을 포함한다. 스푸마레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
다른 실시형태에서, 본 개시내용은 XDP의 레트로바이러스 성분이 레트로바이러스과의 상이한 속으로부터 선택되는 XDP를 제공한다. 따라서 XDP는 매트릭스 폴리펩티드(MA), p2A 스페이서 펩티드, p2B 스페이서 펩티드; p10 스페이서 펩티드, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), pp21/24 스페이서 펩티드, p3-P8 스페이서 펩티드, pp12 스페이서 펩티드, p20 스페이서 펩티드, p1/p6 스페이서 펩티드, p68 Gag, p3 Gag, 절단 부위(들), Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로부터 선택된 2개 이상의 성분을 포함할 수 있으며 여기서 성분은 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 렌티바이러스, 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로부터 유래된다.
HIV-1로부터 유래된 레트로바이러스 성분에서, 부가 단백질 인테그라제 (또는 그의 인코딩 핵산)는 XDP 시스템 뿐만 아니라, HIV 기능적 보조 유전자 vpr, vpx(HIV-2)에서 생략될 수 있으며, 이는 시험관내 바이러스 복제에 필수적이지 않다. 부가적으로, XDP 시스템의 핵산은 실시형태의 XDP 조성물의 생성을 위한 역전사효소를 필요로 하지 않는다. 따라서, 일 실시형태에서, XDP의 HIV-1 Gag-Pol 성분은, 이후에 Gag-TFR-PR로 지칭되고 아래에서 보다 완전하게 기술된, 프로테아제 절단 부위에 의해 분리된 트랜스프레임 옥타펩티드(TFP) 및 p6pol의 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 연결된 Gag로 끝이 절단될 수 있다.
c. 프로테아제
XDP 시스템의 일부 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 레트로바이러스과의 임의의 속을 포함하는 레트로바이러스 프로테아제로부터 선택된다. 예를 들어, 프로테아제는 표 5에 제시된 서열번호: 198, 234, 239, 245, 251, 257, 261, 266, 271, 276, 282, 287, 291, 296, 301, 및 306으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩될 수 있다. 다른 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 턴그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제(MMP-2, -3, -7, -9, -10 및 -11 포함) 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택된 비-레트로바이러스의 이종성 프로테아제이다. 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 PreScission 프로테아제; 인간 라이노바이러스(HRV) 3C 프로테아제와 글루타티온 S-트랜스퍼라제(GST)의 융합 단백질이다. 또 다른 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 담배 식각 바이러스 프로테아제(TEV)이다. 또 다른 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제이다. HIV-1 프로테아제의 경우, 전구체 Gag--Pol 폴리단백질의 99-아미노산 프로테아제(PR)(이는 Gag--Pol 전구체의 합성이 -1 프레임이동 이벤트를 초래하도록 개방 판독 프레임을 중첩함에 의해 인코딩됨)는 프로테아제 절단 부위에 의해 분리된 p6pol의 트랜스프레임 옥타펩티드(TFP) 및 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 의해 그 N-말단에 측접된다. 프로테아제의 유리 N-말단을 방출하기 위한 p6pol-PR 부위에서의 절단은 효소적 활성의 출현 및 성숙한 프로테아제의 특징인 안정적인 3차 구조의 형성과 동시에 발생한다(Louis, JM. 등 Autoprocessing of HIV-1 protease is tightly coupled to protein folding. Nat Struct Mol Biol 6, 868-875 (1999)). 핵산이 HIV-1 Gag-Pol 폴리단백질의 전부 또는 일부를 인코딩하는 XDP 시스템의 일부 실시형태에서, Gag-Pol 서열은 -1 프레임이동 이벤트를 용이하게 하기 위해 인코딩된 TFR-PR을 포함한다. XDP 시스템이 Gag 폴리단백질로 구성된 성분 및 TFR과 프로테아제를 포함하는 pol 폴리단백질의 일부를 이용하는 일부 경우에, 성분은 본 명세서에서 "Gag-TFR-PR"로 지칭되며, 여기서 -1 프레임이동 이벤트를 용이하게 하는 능력은 인코딩된 프로테아제를 생성하는 능력과 함께 유지된다. 레트로바이러스 프로테아제를 인코딩하는 핵산의 비-제한적인 예에서, XDP 시스템 실시형태의 인코딩 플라스미드 내에 혼입될 수 있으며, 대표적인 서열이 표 5에 제공되어 있다.
프로테아제 절단 부위가 XDP 시스템에 혼입되는 상응하는 양식에서, XDP의 인코딩된 단백질 및 핵산 내의 이들의 인코딩 서열에 이용되는 프로테아제 절단 부위는 XDP 시스템에 혼입되는 프로테아제와 상관관계가 있을 것이다. 일부 실시형태에서, Gag 폴리단백질의 전부 또는 일부를 포함하는 XDP 성분의 프로테아제 절단 부위는 Gag 폴리단백질과 치료 페이로드 사이에 위치되어 XDP 입자의 성숙시, 치료 페이로드가 Gag 폴리단백질의 어떤 성분에도 묶여 있지 않도록 된다. 다른 실시형태에서, 프로테아제 절단 부위는 Gag 폴리단백질의 개별 성분 사이 뿐만 아니라 Gag 폴리단백질과 치료 페이로드 사이에 혼입된다. 프로테아제 절단 부위를 절단할 수 있는 프로테아제가 TEV인 대표적인 실시형태에서, 인코딩된 TEV 프로테아제 절단 부위는 서열 EXXYXQ(G/S)(서열번호: 17), ENLYFQG(서열번호: 18) 또는 ENLYFQS(서열번호: 19)를 가질 수 있으며, 여기서 X는 임의의 아미노산을 나타내고 TEV에 의한 절단은 Q와 G 또는 Q와 S 사이에서 발생한다. 프로테아제가 HIV-1 프로테아제인 또 다른 실시형태에서, 인코딩된 HIV-1 절단 부위는 서열 SQNYPIVQ(서열번호: 20)를 가질 수 있다. 프로테아제가 PreScission인 또 다른 실시형태에서, 프로테아제 절단 부위는 Gln 및 Gly 잔기 사이를 절단하는 코어 아미노산 서열 Leu-Phe-Gln/Gly-Pro(서열번호: 1010)를 포함한다. 일 실시형태에서, 절단 부위를 포함하는 XDP는 동일한 프로테아제 절단 부위를 갖는다. 또 다른 실시형태에서, 절단 부위를 포함하는 XDP는 상이한 프로테아제 절단 부위를 가지고 상이한 프로테아제에 대한 기질이다. 또 다른 실시형태에서, XDP 시스템은 2개의 상이한 프로테아제; 예를 들어, HIV-1 및 PreScission 프로테아제에 의한 절단에 민감한 절단 서열을 포함할 수 있다. 그러한 경우에, XDP를 인코딩하는 핵산은 양 프로테아제 모두에 대한 인코딩 서열을 포함할 것이다.
추가적인 프로테아제 절단 부위는 본 발명의 XDP의 범주 내인 것으로 예상되고, 특히 서열번호: 874-897, 및 934-946을 포함한다.
d. XDP 시스템의 단백질 및 핵산 치료 페이로드
본 개시내용의 XDP에 포함하기에 적합한 단백질 치료 페이로드는 사이토카인(예를 들어, IFN α, β, 및 γ, TNF-α, G-CSF, GM-CSF)), 인터루킨(예를 들어, IL-1에서 IL-40), 성장 인자(예를 들어, VEGF, PDGF, IGF-1, EGF 및 TGF-β), 효소, 수용체, 마이크로단백질, 호르몬(예를 들어, 성장 호르몬, 인슐린), 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자(예를 들어, FVII, FVIII, FIX, FX), 항응고제, 골형성 단백질, 조작된 단백질 스캐폴드, 혈전용해제(예를 들어, 스트렙토키나제, 조직 플라스미노겐 활성화제, 플라스미노겐, 및 플라스미드), CRISPR 단백질(클래스 1 및 클래스 2 유형 II, 유형 V 또는 유형 VI) 뿐만 아니라 조작된 단백질 예컨대 신경계, 대사, 심혈관, 간, 신장 또는 내분비 질환 및 장애와 같은 질환을 치료하기 위한 항암 요법 또는 생물학적제제를 포함하지만 이에 제한되지 않는 다양한 범주의 단백질-기반 치료제를 포함한다. 본 개시내용의 XDP에 포함하기에 적합한 핵산 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 유전자 요법에 이용되는 핵산(예를 들어, CRISPR 시스템 및 공여자 템플릿에 이용되는 가이드 RNA), 마이크로 RNA, 리보자임, RNA 유인체 및 원형 RNA 뿐만 아니라 전술한 단백질 치료 페이로드를 인코딩하는 서열을 포함하는, 다양한 범주를 포함한다. 특정 실시형태에서, XDP의 단백질 페이로드는 표 1, 7, 8, 9 및 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 및 388-397의 CasX 변이체를 포함하는 본 명세서에 기재된 임의의 실시형태의 CasX 변이체 단백질을 포함하는 반면 핵산 페이로드는 표 3에 제시된 바와 같은 서열번호: 597-781의 스캐폴드 서열을 갖는 gNA 변이체를 포함하는, 본 명세서에 기재된 임의의 실시형태의 하나 이상의 가이드 RNA 및 선택적으로 공여자 템플릿을 포함한다.
e. XDP 시스템의 CRISPR 단백질
일부 실시형태에서, 본 개시내용은 진핵 세포의 게놈 편집에 유용성을 갖는 표적 핵산에 결합하도록 조작된 하나 이상의 가이드 핵산 및 CRISPR 뉴클레아제를 포함하는 XDP 조성물 및 시스템을 제공한다. 일부 실시형태에서, XDP 시스템에 이용된 CRISPR 뉴클레아제는 클래스 2 뉴클레아제이다. 다른 실시형태에서, CRISPR 뉴클레아제는 클래스 2, 유형 V 뉴클레아제이다. 클래스 2, 유형 V CRISPR-Cas 시스템의 구성원은 차이점이 있지만, Cas9 시스템과 구별되는 몇 가지 공통된 특성을 공유한다. 첫째, 유형 V 뉴클레아제는 단일 RNA-가이드된 RuvC 도메인-함유 이펙터를 보유하지만 HNH 도메인이 없고, 이들은 표적 서열의 3' 측에서 G-풍부 PAM에 의존하는 Cas9 시스템과 상이한, 비-표적화된 가닥 상의 표적 영역에 대해 T-풍부 PAM 5' 업스트림에서 인식한다. 유형 V 뉴클레아제는 PAM에 가까운 근위 부위에서 무딘 말단을 생성하는 Cas9와 달리 PAM 서열에 원위에서 엇갈린 이중-가닥 파손을 생성한다. 부가하여, 유형 V 뉴클레아제는 시스에서 표적 dsDNA 또는 ssDNA 결합에 의해 활성화될 때 트랜스에서 ssDNA를 분해한다. 일부 실시형태에서, XDP 실시형태에서 이용되는 유형 V 뉴클레아제는 5' TC PAM 모티프를 인식하고 RuvC 도메인에 의해서만 절단된 엇갈린 말단을 생성한다. 일부 실시형태에서, XDP는 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택되는 클래스 2, 유형 V 뉴클레아제를 포함한다. 특정 실시형태에서, 본 개시내용은 진핵 세포에서 표적 핵산 서열을 변형하도록 특이적으로 설계된 하나 이상의 가이드 핵산(gNA) 및 복합화된 CasX 단백질의 리보핵단백질(RNP)을 포함하는 XDP를 제공한다.
본 명세서에 사용된 용어 "CasX 단백질"은 단백질의 패밀리를 지칭하고, 모든 자연적으로 발생하는 CasX 단백질(또한 본 명세서에서 "야생형" 또는 "참조" CasX로 지칭됨), 뿐만 아니라 자연적으로-발생하는 참조 CasX 단백질에 비해 적어도 하나의 도메인에서 하나 이상의 변형이 있는 CasX 변이체를 포괄한다. 참조 CasX 단백질은 (본 명세서에 참조로 포함된, US20180346927A1 및 WO2018064371A1에 기술된 바와 같이) 델타프로테오박테리아, 플랑크토마이세테스 또는 칸디다투스로부터 단리되거나 유도된 것을 포함하지만 이에 제한되지 않는다. 개시내용의 범주 내에 있는 것으로 고려되는 CasX 변이체의 예시적인 실시형태는 하기 본 명세서에 기재되어 있다.
일부 경우에, 유형 V 참조 CasX 단백질이 델타프로테오박테리아로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다:
1 MEKRINKIRK KLSADNATKP VSRSGPMKTL LVRVMTDDLK KRLEKRRKKP EVMPQVISNN
61 AANNLRMLLD DYTKMKEAIL QVYWQEFKDD HVGLMCKFAQ PASKKIDQNK LKPEMDEKGN
121 LTTAGFACSQ CGQPLFVYKL EQVSEKGKAY TNYFGRCNVA EHEKLILLAQ LKPEKDSDEA
181 VTYSLGKFGQ RALDFYSIHV TKESTHPVKP LAQIAGNRYA SGPVGKALSD ACMGTIASFL
241 SKYQDIIIEH QKVVKGNQKR LESLRELAGK ENLEYPSVTL PPQPHTKEGV DAYNEVIARV
301 RMWVNLNLWQ KLKLSRDDAK PLLRLKGFPS FPVVERRENE VDWWNTINEV KKLIDAKRDM
361 GRVFWSGVTA EKRNTILEGY NYLPNENDHK KREGSLENPK KPAKRQFGDL LLYLEKKYAG
421 DWGKVFDEAW ERIDKKIAGL TSHIEREEAR NAEDAQSKAV LTDWLRAKAS FVLERLKEMD
481 EKEFYACEIQ LQKWYGDLRG NPFAVEAENR VVDISGFSIG SDGHSIQYRN LLAWKYLENG
541 KREFYLLMNY GKKGRIRFTD GTDIKKSGKW QGLLYGGGKA KVIDLTFDPD DEQLIILPLA
601 FGTRQGREFI WNDLLSLETG LIKLANGRVI EKTIYNKKIG RDEPALFVAL TFERREVVDP
661 SNIKPVNLIG VDRGENIPAV IALTDPEGCP LPEFKDSSGG PTDILRIGEG YKEKQRAIQA
721 AKEVEQRRAG GYSRKFASKS RNLADDMVRN SARDLFYHAV THDAVLVFEN LSRGFGRQGK
781 RTFMTERQYT KMEDWLTAKL AYEGLTSKTY LSKTLAQYTS KTCSNCGFTI TTADYDGMLV
841 RLKKTSDGWA TTLNNKELKA EGQITYYNRY KRQTVEKELS AELDRLSEES GNNDISKWTK
901 GRRDEALFLL KKRFSHRPVQ EQFVCLDCGH EVHADEQAAL NIARSWLFLN SNSTEFKSYK
961 SGKQPFVGAW QAFYKRRLKE VWKPNA (서열번호: 1).
어떤 경우에, 유형 V 참조 CasX 단백질이 플랑크토마이세테스로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다:
1 MQEIKRINKI RRRLVKDSNT KKAGKTGPMK TLLVRVMTPD LRERLENLRK KPENIPQPIS
61 NTSRANLNKL LTDYTEMKKA ILHVYWEEFQ KDPVGLMSRV AQPAPKNIDQ RKLIPVKDGN
121 ERLTSSGFAC SQCCQPLYVY KLEQVNDKGK PHTNYFGRCN VSEHERLILL SPHKPEANDE
181 LVTYSLGKFG QRALDFYSIH VTRESNHPVK PLEQIGGNSC ASGPVGKALS DACMGAVASF
241 LTKYQDIILE HQKVIKKNEK RLANLKDIAS ANGLAFPKIT LPPQPHTKEG IEAYNNVVAQ
301 IVIWVNLNLW QKLKIGRDEA KPLQRLKGFP SFPLVERQAN EVDWWDMVCN VKKLINEKKE
361 DGKVFWQNLA GYKRQEALLP YLSSEEDRKK GKKFARYQFG DLLLHLEKKH GEDWGKVYDE
421 AWERIDKKVE GLSKHIKLEE ERRSEDAQSK AALTDWLRAK ASFVIEGLKE ADKDEFCRCE
481 LKLQKWYGDL RGKPFAIEAE NSILDISGFS KQYNCAFIWQ KDGVKKLNLY LIINYFKGGK
541 LRFKKIKPEA FEANRFYTVI NKKSGEIVPM EVNFNFDDPN LIILPLAFGK RQGREFIWND
601 LLSLETGSLK LANGRVIEKT LYNRRTRQDE PALFVALTFE RREVLDSSNI KPMNLIGIDR
661 GENIPAVIAL TDPEGCPLSR FKDSLGNPTH ILRIGESYKE KQRTIQAAKE VEQRRAGGYS
721 RKYASKAKNL ADDMVRNTAR DLLYYAVTQD AMLIFENLSR GFGRQGKRTF MAERQYTRME
781 DWLTAKLAYE GLPSKTYLSK TLAQYTSKTC SNCGFTITSA DYDRVLEKLK KTATGWMTTI
841 NGKELKVEGQ ITYYNRYKRQ NVVKDLSVEL DRLSEESVNN DISSWTKGRS GEALSLLKKR
901 FSHRPVQEKF VCLNCGFETH ADEQAALNIA RSWLFLRSQE YKKYQTNKTT GNTDKRAFVE
961 TWQSFYRKKL KEVWKPAV (서열번호: 2).
어떤 경우에, 유형 V 참조 CasX 단백질이 칸디다투스 성박테리아로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다
1 MDNANKPSTK SLVNTTRISD HFGVTPGQVT RVFSFGIIPT KRQYAIIERW FAAVEAARER
61 LYGMLYAHFQ ENPPAYLKEK FSYETFFKGR PVLNGLRDID PTIMTSAVFT ALRHKAEGAM
121 AAFHTNHRRL FEEARKKMRE YAECLKANEA LLRGAADIDW DKIVNALRTR LNTCLAPEYD
181 AVIADFGALC AFRALIAETN ALKGAYNHAL NQMLPALVKV DEPEEAEESP RLRFFNGRIN
241 DLPKFPVAER ETPPDTETII RQLEDMARVI PDTAEILGYI HRIRHKAARR KPGSAVPLPQ
301 RVALYCAIRM ERNPEEDPST VAGHFLGEID RVCEKRRQGL VRTPFDSQIR ARYMDIISFR
361 ATLAHPDRWT EIQFLRSNAA SRRVRAETIS APFEGFSWTS NRTNPAPQYG MALAKDANAP
421 ADAPELCICL SPSSAAFSVR EKGGDLIYMR PTGGRRGKDN PGKEITWVPG SFDEYPASGV
481 ALKLRLYFGR SQARRMLTNK TWGLLSDNPR VFAANAELVG KKRNPQDRWK LFFHMVISGP
541 PPVEYLDFSS DVRSRARTVI GINRGEVNPL AYAVVSVEDG QVLEEGLLGK KEYIDQLIET
601 RRRISEYQSR EQTPPRDLRQ RVRHLQDTVL GSARAKIHSL IAFWKGILAI ERLDDQFHGR
661 EQKIIPKKTY LANKTGFMNA LSFSGAVRVD KKGNPWGGMI EIYPGGISRT CTQCGTVWLA
721 RRPKNPGHRD AMVVIPDIVD DAAATGFDNV DCDAGTVDYG ELFTLSREWV RLTPRYSRVM
781 RGTLGDLERA IRQGDDRKSR QMLELALEPQ PQWGQFFCHR CGFNGQSDVL AATNLARRAI
841 SLIRRLPDTD TPPTP (서열번호: 3).
XDP 시스템의 일부 실시형태에서, 개시내용은 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질의 서열에 비하여 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40 또는 적어도 50 이상의 개별적 또는 순차적 돌연변이를 갖는 서열을 포함하는 XDP에서 사용하기 위한 CasX 변이체 단백질을 제공한다. 이들 돌연변이는 삽입, 결실, 아미노산 치환 또는 이의 임의의 조합일 수 있다. 일부 실시형태에서, 전술한 돌연변이에 부가하여, CasX 변이체는 이종성 참조 CasX로부터 도메인의 일부 또는 전부의 치환을 추가로 포함할 수 있고, 치환된 도메인은 하나 이상의 돌연변이를 추가로 포함할 수 있다. 개시내용의 CasX 변이체 단백질을 생성하기 위한 적합한 돌연변이유발 방법은, 예를 들어, 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 경향있는 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있다. 일부 실시형태에서, CasX 변이체는, 예를 들어, 참조 CasX에서 하나 이상의 원하는 돌연변이를 선택함에 의해 설계된다. 임의의 아미노산은 본 명세서에 기재된 치환에서 임의의 다른 아미노산으로 치환될 수 있다. 치환은 보존적 치환일 수 있다(예를 들어, 염기성 아미노산이 다른 염기성 아미노산으로 치환됨). 치환은 비-보존적 치환일 수 있다(예를 들어, 염기성 아미노산이 산성 아미노산으로 치환되거나 또는 그 반대임). 예를 들어, 참조 CasX 단백질에서 프롤린은 본 개시내용의 CasX 변이체 단백질을 생성하기 위해 아르기닌, 히스티딘, 라이신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신 또는 발린 중 임의의 것으로 치환될 수 있다. 특정 실시형태에서, 참조 CasX 단백질의 활성은 하나 이상의 CasX 변이체의 활성을 비교하여, 이에 의해 CasX 변이체의 기능에서 개선을 측정하는 벤치마크로서 사용된다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 하나의 아미노산 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 1-4개 아미노산, 1-10개 아미노산, 1-20개 아미노산, 1-30개 아미노산, 1-40개 아미노산, 1-50개 아미노산, 1-60개 아미노산, 1-70개 아미노산, 1-80개 아미노산, 1-90개 아미노산, 1-100개 아미노산, 2-10개 아미노산, 2-20개 아미노산, 2-30개 아미노산, 3-10개 아미노산 산, 3-20개 아미노산, 3-30개 아미노산, 4-10개 아미노산, 4-20개 아미노산, 3-300개 아미노산, 5-10개 아미노산, 5-20개 아미노산, 5-30개 아미노산, 10-50개 아미노산 또는 20-50개 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 단백질은 참조 CasX 단백질에 비해 적어도 약 100개 연속적인 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 또는 100개 연속적인 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 연속적인 아미노산의 결실을 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 2개 이상의 결실을 포함하고, 2개 이상의 결실은 연속적인 아미노산이 아니다. 예를 들어, 제1 결실은 참조 CasX 단백질의 제1 도메인에 있을 수 있고 제2 결실은 참조 CasX 단백질의 제2 도메인에 있을 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 비-연속적인 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 20개 비-연속적인 결실을 포함한다. 각각의 비-연속적인 결실은 본 명세서에 기재된 임의의 길이의 아미노산, 예를 들어 1-4개 아미노산, 1-10개 아미노산 등일 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 서열번호: 1, 2, 또는 3의 서열에 비해 하나 이상의 아미노산 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 1개 아미노산의 삽입, 2-3개 연속적인 또는 비-연속적인 아미노산, 2-4개 연속적인 또는 비-연속적인 아미노산, 2-5개 연속적인 또는 비-연속적인 아미노산, 2-6개 연속적인 또는 비-연속적인 아미노산, 2-7개 연속적인 또는 비-연속적인 아미노산, 2-8개 연속적인 또는 비-연속적인 아미노산, 2-9개 연속적인 또는 비-연속적인 아미노산, 2-10개 연속적인 또는 비-연속적인 아미노산, 2-20개 연속적인 또는 비-연속적인 아미노산 산, 2-30개 연속적인 또는 비-연속적인 아미노산, 2-40개 연속적인 또는 비-연속적인 아미노산, 2-50개 연속적인 또는 비-연속적인 아미노산, 2-60개 연속적인 또는 비-연속적인 아미노산, 2-70개 연속적인 또는 비-연속적인 아미노산, 2-80개 연속적인 또는 비-연속적인 아미노산, 2-90개 연속적인 또는 비-연속적인 아미노산, 2-100개 연속적인 또는 비-연속적인 아미노산, 3-10개 연속적인 또는 비-연속적인 아미노산, 3-20개 연속적인 또는 비-연속적인 아미노산, 3-30개 연속적인 또는 비-연속적인 아미노산, 4-10개 연속적인 또는 비-연속적인 아미노산, 4-20개 연속적인 또는 비-연속적인 아미노산, 3-300개 연속적인 또는 비-연속적인 아미노산, 5-10개 연속적인 또는 비-연속적인 아미노산, 5-20개 연속적인 또는 비-연속적인 아미노산, 5-30개 연속적인 또는 비-연속적인 아미노산, 10-50 연속적인 또는 비-연속적인 아미노산 또는 20-50 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 적어도 약 100개 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 임의의 아미노산, 또는 아미노산의 조합이 본 명세서에 기재된 삽입에서 삽입되어 CasX 변이체 단백질을 생성할 수 있다.
본 명세서에 기재된 치환, 삽입 및 결실 실시형태의 임의의 순열을 조합하여 개시내용의 CasX 변이체 단백질을 생성할 수 있다. 예를 들어, CasX 변이체 단백질은 참조 CasX 단백질 서열에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 참조 CasX 단백질 서열에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 참조 CasX 단백질 서열에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 참조 CasX 단백질 서열에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
CasX 변이체는 다음의 도메인: 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 장입(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오티드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인(촉매적으로 사멸된 CasX 변이체에서 결실될 수 있는 후자) 중 일부 또는 전부를 포함하며, 아래에서 보다 완전하게 기술된다. 일부 실시형태에서, CasX 변이체 단백질의 적어도 하나의 변형은 서열번호: 1-3의 서열을 포함하는 참조 CasX 단백질의 한 도메인의 적어도 일부의 결실을 포함한다. 일부 실시형태에서, 결실은 NTSBD, TSLD, 나선형 I 도메인, 나선형 II 도메인, OBD 또는 RuvC DNA 절단 도메인에 있다. 일부 실시형태에서, CasX 변이체는 NTSB 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, CasX 변이체는 TSL 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, TSL 도메인에서 적어도 하나의 변형은 서열번호: 2의 아미노산 Y857, S890, 또는 S932 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 나선형 I 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, 나선형 I 도메인의 적어도 하나의 변형은 서열번호: 2의 아미노산 S219, L249, E259, Q252, E292, L307, 또는 D318 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 나선형 II 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, 나선형 II 도메인에서 적어도 하나의 변형은 서열번호 :2의 아미노산 D361, L379, E385, E386, D387, F399, L404, R458, C477, 또는 D489 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 OBD 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, OBD에서 적어도 하나의 변형은 서열번호: 2의 아미노산 F536, E552, T620, 또는 I658 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 RuvC DNA 절단 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, RuvC DNA 절단 도메인에서 적어도 하나의 변형은 서열번호:2의 아미노산 K682, G695, A708, V711, D732, A739, D733, L742, V747, F755, M771, M779, W782, A788, G791, L792, P793, Y797, M799, Q804, S819, 또는 Y857 중 하나 이상의 아미노산 치환 또는 아미노산 P793의 결실을 포함한다.
일부 실시형태에서, CasX 변이체는 참조 CasX 단백질에 비해: (a) L379R의 아미노산 치환; (b) A708K의 아미노산 치환; (c) T620P의 아미노산 치환; (d) E385P의 아미노산 치환; (e) Y857R의 아미노산 치환; (f) I658V의 아미노산 치환; (g) F399L의 아미노산 치환; (h) Q252K의 아미노산 치환; (i) L404K의 아미노산 치환; 및 (j) P793의 아미노산 결실 중 하나 이상으로부터 선택된 서열번호:2의 적어도 하나의 변형을 포함한다.
개시내용의 CasX 변이체 단백질은 참조 CasX 단백질 및 참조 gNA의 RNP와 비교하여, TTC, ATC, GTC, 또는 CTC로부터 선택된 PAM 서열을 포함하는, PAM TC 모티프를 이용하여, RNP로서 gNA와 복합체를 형성할 때 표적 DNA를 효율적으로 편집 및/또는 결합하는 고양된 능력을 갖는다. 전기한 것에서, PAM 서열은 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP의 편집 효율 및/또는 결합에 비하여 검정 시스템에서 gNA의 표적화 서열과 동일성을 갖는 프로토스페이서의 비-표적 가닥에 대해 적어도 1 뉴클레오티드 5'에 위치된다. 일 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 TTC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 ATC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 CTC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 GTC이다. 전기한 실시형태에서, 하나 이상의 PAM 서열에 대한 증가된 편집 효율 및/또는 결합 친화도는 PAM 서열에 대한 서열번호:1-3의 CasX 단백질 및 표 2의 gNA 중 임의의 하나의 RNP의 편집 효율 및/또는 결합 친화도와 비교하여 적어도 1.5-배 이상 더 크다.
본 명세서에 기재된 참조 CasX 단백질과 비교할 때 CasX 변이체 단백질의 하나 이상의 기능 또는 특성을 개선하는 모든 변이체는 개시내용의 범주 내에 있는 것으로 예상된다. CasX 변이체 실시형태의 예시적인 개선된 특성은, 아래에 더 자세히 기술된 바와 같은, 변이체의 개선된 폴딩, gNA에 대한 개선된 결합 친화성, 표적 핵산에 대한 개선된 결합 친화성, 표적 DNA의 편집 및/또는 결합에서 더 큰 스펙트럼의 PAM 서열을 활용하는 개선된 능력, 표적 DNA의 개선된 풀림, 증가된 편집 활성, 개선된 편집 효율, 개선된 편집 특이성, 효율적으로 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 증가된 뉴클레아제의 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 장입, 단일 가닥 닉킹에 대한 감소된 표적 가닥 장입, 감소된 표적-외 절단, DNA의 비-표적 가닥의 개선된 결합, 개선된 단백질 안정성, 개선된 단백질:gNA(RNP) 복합체 안정성, 개선된 단백질 용해도, 개선된 단백질:gNA(RNP) 복합체 용해도, 개선된 단백질 수율, 개선된 단백질 발현, 및 개선된 융합 특성을 포함하지만 이에 제한되지는 않는다. 일부 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2의 gNA의 RNP에 비해 적어도 약 1.1 내지 약 100,000-배 개선된 하나 이상의 개선된 특성을 나타낸다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2의 gNA의 RNP에 비해 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000-배 이상 개선되었다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2에 제시된 서열번호: 4-16의 참조 gNA의 RNP에 비해 약 1.1 내지 100,00-배, 약 1.1 내지 10,00-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,00-배, 약 100 내지 10,00-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,00-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선된다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2에 제시된 서열번호: 4-16 gNA의 RNP에 비해 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배, 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선된다. 예시적인 개선된 특성은 개선된 편집 효율을 포함한다. 일부 실시형태에서, 20pM 이하의 농도에서 개시내용의 CasX 변이체 단백질 및 gNA를 포함하는 RNP는 적어도 80%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시형태에서, 20pM 이하 농도의 RNP는 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시형태에서, 50pM 이하, 40pM 이하, 30pM 이하, 20pM 이하, 10pM 이하, 또는 5pM 이하 농도에서 RNP는 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. CasX 변이체의 개선된 편집 효율은 개시내용의 gNA와 함께 개시내용의 XDP에 함입을 매우-적합하게 한다.
용어 "CasX 변이체"는 융합 단백질인 변이체를 포함하고; 즉, CasX는 이종성 서열에 "융합"된다. 이것은 CasX 변이체 서열 및 이종성 단백질 또는 이의 도메인에 대한 CasX의 N-말단, C-말단 또는 내부 융합을 포함하는 CasX 변이체를 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 400 내지 2000개 아미노산, 500 내지 1500개 아미노산, 700 내지 1200개 아미노산, 800 내지 1100개 아미노산 또는 900 내지 1000개 아미노산을 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 gNA:표적 DNA 복합체화가 발생하는 채널을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 gNA와 결합하는 계면을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, 참조 CasX 단백질의 일부 실시형태에서, 나선형 I, 나선형 II 및 OBD 도메인은 모두 gNA:표적 DNA 복합체와 접촉하거나 이에 근접하고, 이들 도메인 중 임의의 것 내의 비-인접 잔기에 대한 하나 이상의 변형이 CasX 변이체 단백질의 기능을 향상시킬 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 비-표적 가닥 DNA와 결합하는 채널을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 NTSBD의 비-인접 잔기에 대한 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 PAM과 결합하는 계면을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 나선형 I 도메인 또는 OBD의 비-인접 잔기에 대한 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 비-인접 표면-노출된 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 본 명세서에 사용된 바와 같이, "표면-노출된 잔기"는 CasX 단백질의 표면 상의 아미노산, 또는 골격 또는 측쇄의 일부와 같은 아미노산의 적어도 일부가 단백질의 표면 상에 있는 아미노산을 지칭한다. 수성 세포내 환경에 노출되는 CasX와 같은 세포 단백질의 표면 노출된 잔기는 빈번하게 양으로 하전된 친수성 아미노산, 예를 들어 아르기닌, 아스파라긴, 아스파르테이트, 글루타민, 글루타메이트, 히스티딘, 라이신, 세린 및 트레오닌으로부터 선택된다. 따라서, 예를 들어, 본 명세서에 제공된 변이체의 일부 실시형태에서, 표면 노출된 잔기의 영역은 참조 CasX 단백질과 비교하여 하나 이상의 삽입, 결실 또는 치환을 포함한다. 일부 실시형태에서, 하나 이상의 양으로 하전된 잔기는 하나 이상의 다른 양으로 하전된 잔기, 또는 음으로 하전된 잔기, 또는 비하전된 잔기, 또는 이의 임의의 조합으로 치환된다. 일부 실시형태에서, 치환을 위한 하나 이상의 아미노산 잔기는 근접 결합된 핵산이고, 예를 들어 표적 DNA와 접촉하는 RuvC 도메인 또는 나선형 I 도메인에서의 잔기, 또는 gNA에 결합하는 OBD 또는 나선형 II 도메인에서의 잔기는 하나 이상의 양으로 하전된 또는 극성 아미노산으로 치환될 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질의 도메인에서 소수성 패킹을 통해 코어를 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 어떠한 이론에도 얽매이지 않고 소수성 패킹을 통해 코어를 형성하는 영역은 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판 및 시스테인과 같은 소수성 아미노산에 풍부하다. 예를 들어, 일부 참조 CasX 단백질에서 RuvC 도메인은 활성 부위에 인접한 소수성 포켓을 포함한다. 일부 실시형태에서, 영역의 2 내지 15개 잔기는 하전된 극성 또는 염기-적층이다. 하전된 아미노산(본 명세서에서는 때때로 잔기로 지칭됨)은 예를 들어 아르기닌, 라이신, 아스파르트산 및 글루탐산을 포함할 수 있고, 이들 아미노산의 측쇄는 가교 파트너가 또한 존재한다면 염 가교를 형성할 수 있다. 극성 아미노산은 예를 들어 글루타민, 아스파라긴, 히스티딘, 세린, 트레오닌, 티로신 및 시스테인을 포함할 수 있다. 일부 실시형태에서 극성 아미노산은 그 측쇄의 정체성에 따라 양성자 공여체 또는 수용체로서 수소 결합을 형성할 수 있다. 본 명세서에 사용된 "염기-적층"은 아미노산 잔기(예컨대 트립토판, 티로신, 페닐알라닌, 또는 히스티딘)의 방향족 측쇄와 핵산 내의 적층된 뉴클레오티드 염기의 상호작용을 포함한다. CasX 변이체 단백질의 기능적 부분을 형성하기 위해 매우 공간적으로 근접한 비-인접 아미노산의 영역에 대한 임의의 변형은 개시내용의 범주 내인 것으로 고려된다.
f. 다중 공급원 단백질로부터의 도메인을 갖는 CasX 변이체 단백질
본 명세서에 기재된 바와 같은 2개 이상의 상이한 CasX 단백질, 예컨대 2개 이상의 자연적으로 발생하는 CasX 단백질, 또는 2개 이상의 CasX 변이체 단백질 서열로부터의 단백질 도메인을 포함하는 키메라 CasX 단백질을 포함하는 XDP가 또한 개시내용의 범주 내에서 고려된다. 본 명세서에 사용된 "키메라 CasX 단백질"은 일부 실시형태에서 상이한 종으로부터 단리될 수 있는 2개의 자연적으로 발생하는 단백질과 같은 상이한 공급원으로부터 단리되거나 유래된 적어도 2개의 도메인을 함유하는 CasX를 지칭한다. 예를 들어, 일부 실시형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터 제1 도메인 및 상이한 제2 CasX 단백질로부터 제2 도메인을 포함한다. 일부 실시형태에서, 제1 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD 및 RuvC 도메인으로 구성된 군으로부터 선택될 수 있다. 일부 실시형태에서, 제2 도메인은 전기한 제1 도메인과 상이한 제2 도메인을 갖는 NTSB, TSL, 나선형 I, 나선형 II, OBD 및 RuvC 도메인으로 구성된 군으로부터 선택된다. 예를 들어, 키메라 CasX 단백질은 서열번호: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 I, 나선형 II, OBD 도메인, 및 서열번호: 1의 CasX 단백질로부터의 RuvC 도메인을 포함할 수 있거나, 또는 그 반대일 수 있다. 추가 예로서, 키메라 CasX 단백질은 서열번호: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인, 및 서열번호: 1의 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있거나, 또는 그 반대일 수 있다. 따라서, 특정 실시형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인, 및 제2 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있다. 키메라 CasX 단백질의 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1, 서열번호: 2 또는 서열번호: 3의 서열로부터 유래되고, 제2 CasX 단백질의 도메인은 서열번호: 1, 서열번호: 2 또는 서열번호: 3의 서열로부터 유래되고, 제1 및 제2 CasX 단백질은 동일하지 않는다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 2로부터 유래된 서열을 포함한다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 3으로부터 유래된 서열을 포함한다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 2로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 3으로부터 유래된 서열을 포함한다. 일부 실시형태에서, CasX 변이체는 표 1에 기술된 바와 같은, 서열번호: 102, 113, 114, 115, 103, 104, 105, 106, 107, 108, 109 및 110의 서열을 갖는 CasX 변이체로 구성된 군에서 선택된다.
XDP 시스템의 일부 실시형태에서, CasX 변이체 단백질은 제1 CasX 단백질로부터 제1 부분 및 상이한 제2 CasX 단백질로부터 제2 부분을 포함하는 적어도 하나의 키메라 도메인을 포함한다. 본 명세서에 사용된 "키메라 도메인"은 2개의 자연적으로 발생하는 단백질 또는 2개의 참조 CasX 단백질로부터 도메인의 부분과 같은 상이한 공급원으로부터 단리되거나 유래된 적어도 2개의 부분을 함유하는 도메인을 지칭한다. 적어도 하나의 키메라 도메인은 본 명세서에 기재된 NTSB, TSL, 나선형 I, 나선형 II, OBD 또는 RuvC 도메인 중 임의의 것일 수 있다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 2의 서열을 포함한다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 3의 서열을 포함한다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 2의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 3의 서열을 포함한다. 일부 실시형태에서, 적어도 하나의 키메라 도메인은 키메라 RuvC 도메인을 포함한다. 전기한 것의 예로서, 키메라 RuvC 도메인은 서열번호: 1의 아미노산 661 내지 824 및 서열번호: 2의 아미노산 922 내지 978을 포함한다. 전기한 것의 대안적인 예로서, 키메라 RuvC 도메인은 서열번호: 2의 아미노산 648 내지 812 및 서열번호: 1의 아미노산 935 내지 986을 포함한다. 일부 실시형태에서, CasX 단백질은 제1 CasX 단백질로부터 제1 도메인과 제2 CasX 단백질로부터 제2 도메인, 및 이 단락에 기재된 실시형태의 접근법을 사용하여 상이한 CasX 단백질로부터 단리된 적어도 2개의 부분을 포함하는 적어도 하나의 키메라 도메인을 포함한다. 전기한 실시형태에서, 서열번호: 1, 2 및 3으로부터 유래된 도메인 또는 도메인의 일부를 갖는 키메라 CasX 단백질은 본 명세서에 개시된 실시형태 중 임의의 것의 아미노산 삽입, 결실 또는 치환을 추가로 포함할 수 있다.
XDP 시스템의 일부 실시형태에서, CasX 변이체 단백질은 표 1, 7, 8, 9 또는 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 표 1에 제시된 바와 같은 서열번호: 21-233의 서열로 이루어진다. 다른 실시형태에서, CasX 변이체 단백질은 표 1, 7, 8, 9 또는 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일한 서열을 포함한다. 다른 실시형태에서, CasX 변이체 단백질은 표 1에 제시된 서열을 포함하고, N-말단, C-말단, 또는 둘 모두에서 또는 그 근처에 본 명세서에 개시된 하나 이상의 NLS를 추가로 포함한다. 일부 경우에, 표의 CasX 변이체의 N-말단 메티오닌이 번역-후 변형 동안 발현된 CasX 변이체로부터 제거되는 것으로 이해될 것이다.
[표 1]: CasX 변이체 서열
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
* 숫자가 왼쪽 열에 표시된 경우 그것은 숫자로 CasX 변이체를 지정하며; 표시된 경우 변경은 서열번호:2에 대한 것이다.
g. CasX 융합 단백질
CasX에 융합된 이종성 단백질을 포함하는 CasX 변이체 단백질을 포함하는 XDP가 또한 개시내용의 범주 내에서 고려된다. 일부 실시형태에서, CasX 변이체 단백질은 상이한 관심있는 활성을 갖는 하나 이상의 단백질 또는 그의 도메인에 융합되어 융합 단백질을 초래한다. 예를 들어, 일부 실시형태에서, CasX 변이체 단백질은 전사를 억제하거나, 표적 핵산을 변형하거나, 핵산과 연관된 폴리펩티드를 변형하는 (예를 들어, 히스톤 변형) 단백질 (또는 그의 도메인)에 융합된다.
일부 실시형태에서, 이종성 폴리펩티드 (또는 시스테인 잔기 또는 비-천연 아미노산과 같은 이종성 아미노산)는 XDP 시스템에서 이용되는 CasX 융합 단백질을 생성하기 위해 CasX 단백질 내의 하나 이상의 위치에 삽입될 수 있다. 다른 실시형태에서, 시스테인 잔기는 CasX 단백질 내의 하나 이상의 위치에 삽입되고 이어서 하기에 기재된 이종성 폴리펩티드의 접합이 뒤따를 수 있다. 일부 대안적인 실시형태에서, 이종성 폴리펩티드 또는 이종성 아미노산은 CasX 변이체 단백질의 N- 또는 C-말단에서 첨가될 수 있다. 다른 실시형태에서, 이종성 폴리펩티드 또는 이종성 아미노산은 CasX 단백질의 서열 내에 내부적으로 삽입될 수 있다.
다양한 이종성 폴리펩티드가 개시내용의 XDP 시스템에서 이용되는 CasX 변이체 융합 단백질에 함입되기에 적합하다. 일부 경우에, 융합 파트너는 표적 DNA의 전사를 조절(예를 들어, 전사를 억제, 전사를 증가)할 수 있다. 예를 들어, 일부 경우에 융합 파트너는 전사를 억제하는 단백질(또는 단백질로부터의 도메인)(예를 들어, 전사 억제제 단백질의 동원, 표적 DNA의 변형 예컨대 메틸화, DNA 변형자의 동원, 표적 DNA와 연관된 히스톤의 조절, 히스톤 변형자의 동원 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것, 등을 통해 기능하는 단백질인, 전사 억제인자)이다. 일부 경우에 융합 파트너는 전사를 증가시키는 단백질(또는 단백질의 도메인)(예를 들어, 전사 활성화제 단백질의 동원, 표적 DNA의 변형 예컨대 탈메틸화, DNA 변형자의 동원, 표적 DNA와 연관된 히스톤의 조절, 히스톤 변형자의 동원 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것, 등을 통해 작용하는 단백질인, 전사 활성화제)이다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산을 변형시키는 효소적 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 광분해효소 활성 또는 글리코실라제 활성)을 갖는다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산과 연관된 폴리펩티드(예를 들어, 히스톤)를 변형시키는 효소적 활성(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다.
전사를 증가시키기 위해 XDP 시스템에서 이용되는 CasX 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 활성화제 예컨대 VP16, VP64, VP48, VP160, p65 서브도메인(예를 들어, NFkB로부터의 것), 및 EDLL의 활성화 도메인 및/또는 TAL 활성화 도메인(예를 들어, 식물에서의 활성을 위함); 히스톤 라이신 메틸트랜스퍼라제 예컨대 SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1 등; 히스톤 라이신 데메틸라제 예컨대 JHDM2a/b, UTX, JMJD3 등; 히스톤 아세틸트랜스퍼라제 예컨대 GCN5, PCAF, CBP, p300, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, SRC1, ACTR, P160, CLOCK 등; 및 DNA 데메틸라제 예컨대 Ten-Eleven Translocation(TET) 디옥시게나제 1(TET1CD), TET1, DME, DML1, DML2, ROS1 등을 포함하지만 이에 제한되지 않는다.
전사를 감소시키기 위해 XDP에서 CasX 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 억제인자 예컨대 크루펠 연관된 박스(KRAB 또는 SKD); KOX1 억제 도메인; Mad mSIN3 상호작용 도메인(SID); ERF 억제인자 도메인(ERD), SRDX 억제 도메인(예를 들어, 식물에서 억제를 위함) 등; 히스톤 라이신 메틸트랜스퍼라제 예컨대 Pr-SET7/8, SUV4-20H1, RIZ1 등; 히스톤 라이신 데메틸라제 예컨대 JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID 1C/SMCX, JARID1D/SMCY 등; 히스톤 라이신 데아세틸라제 예컨대 HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등; DNA 메틸라제 예컨대 HhaI DNA m5c-메틸트랜스퍼라제(M.HhaI), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등; 및 주변 동원 요소 예컨대 라민 A, 라민 B 등을 포함하지만 이에 제한되지 않는다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성의 예는 제한 효소에 의해 제공되는 것과 같은 뉴클레아제 활성(예를 들어, FokI 뉴클레아제), 메틸트랜스퍼라제에 의해 제공되는 것과 같은 메틸트랜스퍼라제 활성(예를 들어, Hhal DNA m5c-메틸트랜스퍼라제(M.Hhal), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등); 데메틸라제에 의해 제공되는 것과 같은 데메틸라제 활성(예를 들어, Ten-Eleven Translocation(TET) 디옥시게나제 1(TET 1 CD), TET1, DME, DML1, DML2, ROS1 등), DNA 복구 활성, DNA 손상 활성, 탈아미노효소에 의해 제공되는 것과 같은 탈아미노화 활성(예를 들어, 시토신 탈아미노효소, 예를 들어 APOBEC 단백질 예컨대 랫트 APOBEC1), 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 및/또는 리졸바제에 의해 제공되는 것과 같은 인테그라제 활성(예를 들어, Gin 인버타제 예컨대 Gin 인버타제인, GinH106Y의 과활성 돌연변이체; 인간 면역결핍 바이러스 유형 1 인테그라제(IN); Tn3 리솔바제; 등), 트랜스포사제 활성, 재조합효소에 의해 제공되는 것과 같은 재조합효소 활성(예를 들어, Gin 재조합효소의 촉매 도메인), 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 광분해효소 활성 및 글리코실라제 활성)을 포함하지만 이에 제한되지 않는다.
다른 경우에, XDP 시스템에서 이용되는 본 개시내용의 CasX 변이체 단백질은 전사를 증가시키기 위한 도메인(예를 들어, VP16 도메인, VP64 도메인), 전사를 감소시키기 위한 도메인(예를 들어, Kox1 단백질로부터의, 예를 들어, KRAB 도메인), 히스톤 아세틸트랜스퍼라제의 코어 촉매 도메인(예를 들어, 히스톤 아세틸트랜스퍼라제 p300), 검출가능한 신호를 제공하는 단백질/도메인(예를 들어, GFP와 같은 형광 단백질), 뉴클레아제 도메인(예를 들어, Fokl 뉴클레아제) 및 염기 편집기(예를 들어, APOBEC1과 같은 시티딘 데아미나제)로부터 선택된 폴리펩티드에 융합된다.
또 다른 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)과 연관된 단백질(예를 들어, 히스톤, RNA 결합 단백질, DNA 결합 단백질 등)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성(표적 핵산과 연관된 단백질을 변형시키는 것)의 예는 히스톤 메틸트랜스퍼라제(HMT)에 의해 제공되는 것과 같은 메틸트랜스퍼라제 활성(예를 들어, 잡색 3-9 동족체 1의 억제제(SUV39H1, KMT1A로도 공지됨), 유색성 히스톤 라이신 메틸트랜스퍼라제 2(G9A, KMT1C 및 EHMT2로도 공지됨), SUV39H2, ESET/SETDB 1 등, SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1, DOT1L, Pr-SET7/8, SUV4-20H1, EZH2, RIZ1), 히스톤 데메틸라제에 의해 제공되는 것과 같은 데메틸라제 활성(예를 들어, 라이신 데메틸라제 1A(LSD1로도 공지된 KDM1A), JHDM2a/b, JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY, UTX, JMJD3 등), 아세틸트랜스퍼라제 활성에 의해 제공되는 것과 같은 아세틸트랜스퍼라제 활성(예를 들어, 인간 아세틸트랜스퍼라제 p300, GCN5, PCAF, CBP, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, HB01/MYST2, HMOF/MYST1, SRC1, ACTR, P160, CLOCK 등의 촉매 코어/단편), 히스톤 데아세틸라제에 의해 제공되는 것과 같은 데아세틸라제 활성(예를 들어, HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등), 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 및 탈미리스토일화 활성을 포함하지만 이에 제한되지 않는다.
적합한 엽록체 전이 펩티드는 다음을 포함하지만 이에 제한되지 않는다:
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA (서열번호: 116);
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS (서열번호: 117);
MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC (서열번호: 118;
MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC (서열번호: 119);
MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC (서열번호: 120);
MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLF CSFRISASVATAC (서열번호: 121);
MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPH RFDRRCLSMVV (서열번호: 122);
MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC (서열번호: 123);
MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC (서열번호: 124);
MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVIS RSAAAA (서열번호: 125); 및
MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS (서열번호: 126).
일부 경우에, 본 개시내용의 CasX 변이체 폴리펩티드는 엔도솜 탈출 펩티드를 포함할 수 있다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFXALLXLLXSLWXLLLXA(서열번호: 127)를 포함하며, 여기서 각각의 X는 라이신, 히스티딘, 및 아르기닌으로부터 독립적으로 선택된다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFHALLHLLHSLWHLLLHA(서열번호: 128), 또는 HHHHHHHH(서열번호: 129)를 포함한다.
ssRNA 표적 핵산을 표적화할 때 사용하기 위한 CasX 융합 파트너의 비-제한적인 예는 스플라이싱 인자(예를 들어, RS 도메인); 단백질 번역 성분(예를 들어, 번역 개시, 신장 및/또는 방출 인자, 예를 들어, eIF4G); RNA 메틸라제; RNA 편집 효소(예를 들어, RNA 데아미나제, 예를 들어, A에서 I 및/또는 C에서 U 편집 효소를 포함하는 RNA에 작용하는 아데노신 데아미나제(ADAR)); 헬리카제; RNA-결합 단백질; 등을 포함한다(그러나 이에 제한되지 않는다). 이종성 폴리펩티드는 전체 단백질을 포함할 수 있거나 일부 경우에 단백질의 단편(예를 들어, 기능적 도메인)을 포함할 수 있는 것으로 이해된다.
융합 파트너는 일시적으로든 비가역적으로든, 직접적으로든 간접적으로든, 하기를 포함하는 군으로부터 선택된 이펙터 도메인을 포함하지만 이에 제한되지 않는, (본 개시내용의 목적을 위해, 분자내 및/또는 분자간 2차 구조, 예를 들어 헤어핀, 줄기-고리 등과 같은 이중-가닥 RNA 이중체를 포함하는) ssRNA와 상호작용할 수 있는 임의의 도메인일 수 있다: 엔도뉴클레아제(예를 들어, RNase III, CRR22 DYW 도메인, Dicer 및 SMG5 및 SMG6과 같은 단백질로부터의 PIN(PilT N-말단) 도메인); RNA 절단을 자극하는 것을 담당하는 단백질 및 단백질 도메인(예를 들어, CPSF, CstF, CFIm 및 CFIIm); 엑소뉴클레아제(예를 들어, XRN-1 또는 엑소뉴클레아제 T); 데아데닐라제(예를 들어, HNT3); 넌센스 매개된 RNA 붕괴를 담당하는 단백질 및 단백질 도메인(예를 들어, UPF1, UPF2, UPF3, UPF3b, RNP SI, Y14, DEK, REF2 및 SRm160); RNA 안정화를 담당하는 단백질 및 단백질 도메인(예를 들어, PABP); 번역 억제를 담당하는 단백질 및 단백질 도메인(예를 들어, Ago2 및 Ago4); 번역 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, Staufen); 번역 조절을 담당하는(예를 들어, 할 수 있는) 단백질 및 단백질 도메인(예를 들어, 번역 인자 예컨대 개시 인자, 연장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 담당하는 단백질 및 단백질 도메인(예를 들어, PAP1, GLD-2 및 Star-PAP); RNA의 폴리우리디닐화를 담당하는 단백질 및 단백질 도메인(예를 들어, C1 D1 및 말단 우리딜레이트 트랜스퍼라제); RNA 국소화를 담당하는 단백질 및 단백질 도메인(예를 들어, IMP1, ZBP1, She2p, She3p 및 Bicaudal-D 유래); RNA의 핵 보유를 담당하는 단백질 및 단백질 도메인(예를 들어, Rrp6); RNA의 핵 유출을 담당하는 단백질 및 단백질 도메인(예를 들어, TAP, NXF1, THO, TREX, REF 및 Aly); RNA 스플라이싱의 억제를 담당하는 단백질 및 단백질 도메인(예를 들어, PTB, Sam68 및 hnRNP A1); RNA 스플라이싱의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, 세린/아르기닌-풍부(SR) 도메인); 전사의 효율을 감소시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어, FUS(TLS)); 및 전사 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, CDK7 및 HIV Tat). 대안적으로, 이펙터 도메인은 엔도뉴클레아제; RNA 절단을 자극할 수 있는 단백질 및 단백질 도메인; 엑소뉴클레아제; 데아데닐라제; 넌센스 매개된 RNA 붕괴 활성을 갖는 단백질 및 단백질 도메인; RNA를 안정화할 수 있는 단백질 및 단백질 도메인; 번역을 억제할 수 있는 단백질 및 단백질 도메인; 번역을 자극할 수 있는 단백질 및 단백질 도메인; 번역을 조절할 수 있는 단백질 및 단백질 도메인(예를 들어, 번역 인자 예컨대 개시 인자, 연장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 할 수 있는 단백질 및 단백질 도메인; RNA의 폴리우리디닐화를 할 수 있는 단백질 및 단백질 도메인; RNA 국소화 활성을 갖는 단백질 및 단백질 도메인; RNA의 핵 보유를 할 수 있는 단백질 및 단백질 도메인; RNA 핵 유출 활성을 갖는 단백질 및 단백질 도메인; RNA 스플라이싱의 억제를 할 수 있는 단백질 및 단백질 도메인; RNA 스플라이싱의 자극을 할 수 있는 단백질 및 단백질 도메인; 전사의 효율을 감소시킬 수 있는 단백질 및 단백질 도메인; 및 전사를 자극할 수 있는 단백질 및 단백질 도메인을 포함하는 군으로부터 선택될 수 있다. 또 다른 적합한 이종성 폴리펩티드는 WO2012068627에 더 자세히 기술되어 있는 PUF RNA-결합 도메인이며, 이는 그 전체가 참고로 본 명세서에 포함된다.
XDP 시스템에서 CasX 융합 파트너로서 (전체적으로 또는 이의 단편으로서) 사용될 수 있는 일부 RNA 스플라이싱 인자는 별도의 서열-특이적 RNA 결합 모듈 및 스플라이싱 이펙터 도메인을 갖는 모듈식 조직화를 갖는다. 예를 들어, 세린/아르기닌-풍부(SR) 단백질 패밀리의 구성원은 엑손 함입을 촉진하는 pre-mRNA 및 C-말단 RS 도메인에서 엑손 스플라이싱 인핸서(ESE)에 결합하는 N-말단 RNA 인식 모티프(RRM)를 함유한다. 또 다른 예로서, hnRNP 단백질 hnRNP A1은 그 RRM 도메인을 통해 엑손 스플라이싱 사일런서(ESS)에 결합하고 C-말단 글리신-풍부 도메인을 통해 엑손 함입을 억제한다. 일부 스플라이싱 인자는 2개의 대체적인 부위 사이의 조절 서열에 결합함에 의해 스플라이스 부위(ss)의 대체적인 사용을 조절할 수 있다. 예를 들어, ASF/SF2는 ESE를 인식하고 인트론 근위 부위의 사용을 촉진할 수 있는 반면, hnRNP A1은 ESS에 결합하고 인트론 원위 부위의 사용을 향해 스플라이싱을 이동할 수 있다. 이러한 요인에 대한 하나의 적용은 내인성 유전자, 특히 질환 연관된 유전자의 대체적인 스플라이싱을 조절하는 ESF를 생성하는 것이다. 예를 들어, Bcl-x pre-mRNA는 반대 기능의 단백질을 인코딩하기 위해 2개의 대체적인 5' 스플라이스 부위가 있는 2개의 스플라이싱 이소폼을 생성한다. 긴 스플라이싱 이소폼 Bcl-xL은 수명이 긴 유사분열 후 세포에서 발현되는 강력한 세포자멸사 억제제이고 많은 암세포에서 상향-조절되어 세포를 세포자멸사 신호에 대해 보호한다. 짧은 이소폼 Bcl-xS는 향-세포자멸사 이소폼이고 회전율이 높은 세포(예를 들어, 림프구 발달)에서 높은 수준으로 발현된다. 2개의 Bcl-x 스플라이싱 이소폼의 비율은 코어 엑손 영역 또는 엑손 확장 영역(즉, 2개의 대체적인 5' 스플라이스 부위 사이)에 위치한 다중 시스-요소에 의해 조절된다. 더 많은 예는 WO2010075303을 참고하며, 이는 그 전체가 참고로 본 명세서에 포함된다.
XDP 시스템에서 이용되는 추가의 적합한 CasX 융합 파트너는 경계 요소인 단백질(또는 이의 단편)(예를 들어, CTCF), 말초 동원을 제공하는 단백질 및 이의 단편(예를 들어, 라민 A, 라민 B 등) 및 단백질 도킹 요소(예를 들어, FKBP/FRB, Pill/Abyl 등)를 포함하지만 이에 제한되지 않는다.
일부 경우에, 이종성 폴리펩티드(융합 파트너)는 그것이 융합되는 CasX의 세포하 국소화를 제공하며, 즉, 이종성 폴리펩티드는 세포하 국소화 서열(예를 들어, 핵에 표적화하기 위한 핵 국소화 신호(NLS), 핵 밖으로 융합 단백질을 유지하는 서열, 예를 들어, 핵의 유출 서열(NES), 세포질에 보유된 융합 단백질을 유지하는 서열, 미토콘드리아를 표적으로 하기 위한 미토콘드리아 국소화 신호, 엽록체에 표적화하기 위한 엽록체 국소화 신호, ER 보유 신호 등)을 함유한다. 일부 실시형태에서, 대상체 RNA-가이드된 폴리펩티드는 단백질이 핵에 표적화되지 않도록 NLS를 포함하지 않는다(이는 예를 들어 표적 핵산이 세포질에 존재하는 RNA인 경우 유리할 수 있다). 일부 실시형태에서, 융합 파트너는 추적 및/또는 정제의 용이성을 위한 태그(즉, 이종성 폴리펩티드가 검출가능한 표지임)(예를 들어, 형광 단백질, 예를 들어, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), mCherry, tdTomato 등; 히스티딘 태그, 예를 들어, 6XHis 태그; 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그; 등)를 제공할 수 있다.
일부 경우에, XDP 시스템에서 사용하기 위한 CasX 변이체 단백질은 핵 국소화 신호(NLS)를 포함한다(이에 융합된다). 일부 경우에, CasX 변이체 단백질은 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상 6개 이상, 7개 이상, 8개 이상의 NLS에 융합된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및/또는 C-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 C-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및 C-말단 둘 모두에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, NLS는 N-말단에 위치되고 NLS는 C-말단에 위치된다. 일부 경우에, CasX 변이체 단백질은 1 내지 10 NLS(예를 들어, 1-9, 1-8, 1-7, 1-6, 1-5, 2-10, 2-9, 2-8, 2-7, 2-6 또는 2-5 NLS)를 포함한다(이에 융합된다). 일부 경우에, CasX 변이체 단백질은 2 내지 5 NLS(예를 들어, 2-4 또는 2-3 NLS)를 포함한다(이에 융합된다).
NLS의 비-제한적인 예는 아미노산 서열 PKKKRKV(서열번호: 130)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호: 131)를 갖는 뉴클레오플라스민 이분 NLS; 아미노산 서열 PAAKRVKLD(서열번호: 132) 또는 RQRRNELKRSP(서열번호: 133)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134)를 갖는 hRNPA1 M9 NLS; 임포트인-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호:135); 근종 T 단백질의 서열 VSRKRPRP(서열번호: 136) 및 PPKKARED(서열번호: 137); 인간 p53의 서열 PQPKKKPL(서열번호: 138); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호: 139); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호: 140) 및 PKQKKRK(서열번호: 141); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호: 142); 마우스 Mxl 단백질의 서열 REKKKFLKRR(서열번호: 143); 인간 폴리(ADP-리보스) 폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호: 144); 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호: 145); 보르나 질환 바이러스 P 단백질(BDV-P1)의 서열 PRPRKIPR(서열번호: 146); C형 간염 바이러스 비구조 단백질(HCV-NS5A)의 서열 PPRKKRTVV(서열번호: 147); LEF1의 서열 NLSKKKKRKREK(서열번호: 148); ORF57 시미래의 서열 RRPSRPFRKP(서열번호: 149); EBV LANA의 서열 KRPRSPSS(서열번호: 150); 인플루엔자 A 단백질의 서열 KRGINDRNFWRGENERKTR(서열번호: 151); 인간 RNA 헬리카제 A(RHA)의 서열 PRPPKMARYDN(서열번호: 152); 핵형 RNA 헬리카제 II의 서열 KRSFSKAF(서열번호: 153); TUS-단백질의 서열 KLKIKRPVK(서열번호: 154); 임포트인-알파와 연관된 서열 PKKKRKVPPPPAAKRVKLD(서열번호: 155); HTLV-1에서 Rex 단백질로부터 서열 PKTRRRPRRSQRKRPPT(서열번호: 156); 예쁜꼬마선충의 EGL-13 단백질로부터 서열 MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157); 및 서열 KTRRRPRRSQRKRPPT(서열번호: 158), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로부터 유래된 서열을 포함한다. 일반적으로, NLS(또는 다중 NLS)는 진핵 세포의 핵에서 참조 또는 CasX 변이체 융합 단백질의 축적을 유도하기에 충분한 강도의 것이다. 핵내 축적의 검출은 임의의 적절한 기술에 의해 수행될 수 있다. 예를 들어, 검출가능한 마커는 세포 내의 위치가 시각화될 수 있도록 참조 또는 CasX 변이체 융합 단백질에 융합될 수 있다. 세포 핵은 또한 세포로부터 단리될 수 있으며, 그 내용물은 그 다음 면역조직화학, 웨스턴 블롯 또는 효소 활성 검정과 같은 단백질을 검출하기 위한 임의의 적절한 프로세스에 의해 분석될 수 있다. 핵내 축적도 결정될 수 있다.
일부 경우에, 참조 또는 CasX 변이체 융합 단백질은 지질 이중층, 미셀, 세포막, 소기관 막 또는 소포막을 횡단하는 것을 용이하게 하는 단백질, 폴리뉴클레오티드, 탄수화물 또는 유기 또는 무기 화합물을 지칭하는 "단백질 형질도입 도메인" 또는 PTD(CPP - 세포 투과 펩티드로도 공지됨)를 포함한다. 작은 극성 분자에서 큰 거대분자 및/또는 나노입자의 범위일 수 있는 또 다른 분자에 부착된 PTD는 분자가 막을 횡단하는 것, 예를 들어, 세포외 공간에서 세포내 공간으로 또는 세포질에서 소기관 내로의 이동을 촉진한다. 일부 실시형태에서, PTD는 참조 또는 CasX 변이체 융합 단백질의 아미노 말단에 공유적으로 연결된다. 일부 실시형태에서, PTD는 참조 또는 CasX 변이체 융합 단백질의 카르복실 말단에 공유적으로 연결된다. 일부 경우에, PTD는 적절한 삽입 부위에서 참조 또는 CasX 변이체 융합 단백질의 서열에 내부적으로 삽입된다. 일부 경우에, 참조 또는 CasX 변이체 융합 단백질은 하나 이상의 PTD(예를 들어, 2개 이상, 3개 이상, 4개 이상의 PTD)를 포함한다(이에 접합된다, 융합된다). 일부 경우에, PTD는 하나 이상의 핵 국소화 신호(NLS)를 포함한다. PTD의 예는 YGRKKRRQRRR(서열번호: 167), RKKRRQRR(서열번호: 168)을 포함하는 HIV TAT의 펩티드 형질도입 도메인; YARAAARQARA(서열번호: 169); THRLPRRRRRR(서열번호: 170); 및 GGRRARRRRRR(서열번호: 171); 세포 내로의 진입을 지시하기에 충분한 수의 아르기닌을 포함하는 폴리아르기닌 서열(예를 들어, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10-50 아르기닌(서열번호: 172)); VP22 도메인(Zender 등 (2002) Cancer Gene Ther. 9(6):489-96); 초파리 안테나페디아 단백질 형질도입 도메인(Noguchi 등 (2003) Diabetes 52(7): 1732-1737); 절단된 인간 칼시토닌 펩티드(Trehin 등 (2004) Pharm. Research 21:1248-1256); 폴리리신(Wender 등 (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008); RRQRRTSKLMKR(서열번호: 173); 트랜스포탄 GWTLNSAGYLLGKINLKALAALAKKIL(서열번호: 174); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(서열번호: 175); 및 RQIKIWFQNRRMKWKK(서열번호: 176)를 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, PTD는 활성화가능한 CPP(ACPP)이다(Aguilera 등 (2009) Integr Biol (Comb) June; 1(5-6): 371-381). ACPP는 절단가능한 링커를 통해 일치하는 다중음이온(예를 들어, Glu9 또는 "E9")에 연결된 다중양이온성 CPP(예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0으로 감소시키고 이에 의해 세포로의 부착 및 흡수를 억제한다. 링커의 절단시 다중음이온이 방출되어, 폴리아르기닌과 그 고유의 접착성을 국부적으로 벗겨내고, 따라서 ACPP를 "활성화"하여 막을 횡단한다.
일부 실시형태에서, 참조 또는 CasX 변이체 융합 단백질은 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 내부로 삽입된 이종성 아미노산 또는 이종성 폴리펩티드(이종성 아미노산 서열)에 연결된 CasX 단백질을 포함할 수 있다. 일부 실시형태에서, 참조 또는 CasX 변이체 융합 단백질은 C-말단 및/또는 N-말단 끝에서 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 이종성 폴리펩티드(융합 파트너)에 연결될 수 있다. 링커 폴리펩티드는 다양한 아미노산 서열 중 어느 하나를 가질 수 있다. 다른 화학적 연결이 배제되지는 않지만 단백질은 일반적으로 유연한 성질의 스페이서 펩티드에 의해 연결될 수 있다. 적합한 링커는 4개 아미노산 내지 40개 아미노산 길이, 또는 4개 아미노산 내지 25개 아미노산 길이의 폴리펩티드를 포함한다. 이들 링커는 일반적으로 합성적 링커-인코딩 올리고뉴클레오티드를 사용하여 단백질을 커플링함에 의해 생성된다. 어느 정도의 유연성이 있는 펩티드 링커가 사용될 수 있다. 연결 펩티드는 실질적으로 임의의 아미노산 서열을 가질 수 있으며, 바람직한 링커는 일반적으로 유연한 펩티드를 초래하는 서열을 가질 것이라는 점을 염두에 둔다. 글리신 및 알라닌과 같은 작은 아미노산의 사용은 유연한 펩티드를 만드는 데 유용하다. 이러한 서열의 생성은 당업자에게 일상적이다. 다양한 상이한 링커가 상업적으로 이용가능하고 사용하기에 적합한 것으로 간주된다. 예시적인 링커 폴리펩티드는 글리신 중합체 (G)n, 글리신-세린 중합체(예를 들어, (GS)n, GSGGSn(서열번호: 177), GGSGGSn(서열번호: 178) 및 GGGSn(서열번호: 179)를 포함하며, 여기서 n은 적어도 하나의 정수임), 글리신-알라닌 중합체, 알라닌-세린 중합체, 글리신-프롤린 중합체, 프롤린 중합체 및 프롤린-알라닌 중합체를 포함한다. 예시적인 링커는 GGSG(서열번호: 180), GGSGG(서열번호: 181), GSGSG(서열번호: 182), GSGGG(서열번호: 183), GGGSG(서열번호: 184), GSSSG(서열번호: 185), GPGP(서열번호: 186), GGP, PPP, PPAPPA(서열번호: 187), PPPGPPP(서열번호: 188) 등을 포함하지만 이에 제한되지 않는 아미노산 서열을 포함할 수 있다. 통상의 기술자는 상기 기재된 임의의 요소에 접합된 펩티드의 설계는 링커가 유연성 링커뿐만 아니라 유연성이 덜한 구조를 부여하는 하나 이상의 부분을 포함할 수 있도록 모두 또는 부분적으로 유연한 링커를 포함할 수 있음을 인식할 것이다.
h. XDP 시스템의 가이드 핵산
또 다른 양태에서, 개시내용은 CasX:gNA 시스템의 가이드 핵산(gNA)을 인코딩하거나 통합하는 XDP 시스템 성분에 관한 것으로 여기서 gNA는 편집될 표적 핵산 서열에 상보적이도록 조작된 표적화 서열을 포함한다. 일부 실시형태에서, gNA는 상보적 비-표적 가닥에 TC 모티프를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 특이성을 갖는 CRISPR 단백질과 복합체를 형성할 수 있고, 여기서 PAM 서열은 표적 핵산의 표적 가닥에서 표적 핵산 서열에 상보적인 비-표적 가닥에서의 서열의 1개 뉴클레오티드 5'에 위치된다. 일부 실시형태에서, gNA는 클래스 2, 유형 V CRISPR 뉴클레아제와 복합체를 형성할 수 있다. 특정 실시형태에서, gNA는 CasX 뉴클레아제와 복합체를 형성할 수 있다.
참조 또는 자연적으로-발생하는 gNA는 표 2의 서열을 포함하여, 델타프로테오박터, 플랑크토마이세테스 또는 칸디다투스(본 명세서에 참고로 포함된, US20180346927A1 및 WO2018064371A1에 기재된 바와 같음)로부터 단리되거나 유래된 것을 포함하지만 이에 제한되지는 않는다. XDP 시스템의 일부 실시형태에서, 개시내용은 자연적으로-발생하는 gNA에 대해 하나 이상의 변형을 갖는 gNA 변이체를 제공하며, 변형된 gNA는 이후에 "gNA 변이체"로 지칭된다. 일부 경우에, 인코딩된 gNA 변이체는 참조 gNA의 서열에 대해 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 또는 적어도 20, 또는 적어도 21, 또는 적어도 22, 또는 적어도 23, 또는 적어도 24, 또는 적어도 25 돌연변이를 갖는 서열을 포함하거나 이로 구성된다. 이들 돌연변이는 삽입, 결실, 뉴클레오티드 치환 또는 이의 임의의 조합일 수 있다. 일부 실시형태에서, gNA 변이체는 리보핵산 분자("gRNA")이다. 다른 실시형태에서, gNA 변이체는 우리딘 뉴클레오티드가 티미딘으로 대체된 데옥시리보핵산 분자("gDNA")이다. 일부 실시형태에서, gNA는 키메라이고, DNA 및 RNA 둘 모두를 포함한다.
XDP 시스템의 일부 실시형태에서, 다중 gNA(예를 들어, 2, 3, 4 또는 그 초과 gNA)가 표적 핵산의 변형을 위해 XDP 입자 내의 표적 세포 또는 조직에 전달되는 것으로 구상된다. 예를 들어, 단백질-인코딩 유전자 및/또는 조절 요소의 결실이 바람직한 경우, 유전자 또는 조절 요소 내의 2개의 상이한 부위에 결합하고 절단하기 위해 표적 핵산의 상이한 영역에 대한 표적화 서열을 갖는 한 쌍의 gNA가 사용될 수 있으며, 이는 그 다음 비-상동성 말단 연결(NHEJ), 상동-지향된 복구(HDR), 상동-독립적 표적화된 통합(HITI), 미세-상동 매개된 말단 연결(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 복구(BER)에 의해 편집된다. 예를 들어, 하나 이상의 돌연변이 엑손 또는 서로 원위에 있는 둘 이상의 돌연변이를 갖는 표적 핵산의 서열을 결실하도록 설계된 편집 이벤트 경우, 한 쌍의 gNA는 CRISPR 뉴클레아제가 유전자 내에서 돌연변이(들)를 보유하는 엑손(들)의 2개의 상이한 부위 5' 및 3'에 결합하고 절단할 수 있도록 XDP 내에 통합될 수 있다. 핵산과 관련하여, 절단은 뉴클레아제에 의해, DNA 또는 RNA 중 하나인 핵산 분자의 공유 골격의 파단을 지칭한다. 단일-가닥 절단 및 이중-가닥 절단 둘 모두가 가능하고, 이중-가닥 절단은 2개의 별개의 단일-가닥 절단 이벤트의 결과로 발생할 수 있다. 일부 실시형태에서, 본 명세서에 기재된 실시형태의 CasX:gNA 시스템 및 세포 복구 시스템에 의해 도입된 작은 삽입결실은 돌연변이 유전자의 단백질 판독 프레임을 복원할 수 있다("리프레이밍" 전략). 리프레이밍 전략이 사용될 때 세포는 단일 gNA와 접촉될 수 있다. 유전자의 긴 세그먼트을 결실시키는 경우에, 개시내용은 그것이 결실되거나 정확한 서열을 갖는 공여자 주형으로 대체될 수 있도록 세그먼트 5' 및 3'에 측접하는 표적화 서열의 사용을 고려한다. 다른 경우에, HTT 유전자의 결실 또는 녹-다운/녹-아웃이 바람직한 경우, 표적 핵산 서열의 상이하거나 중첩되는 영역에 대한 표적화 서열을 갖는 한 쌍의 gNA가 결합하기 위해 그리고 CasX를 유전자의 엑손 또는 조절 요소 내 또는 그 근위에 2개의 상이하거나 중첩하는 부위에서 절단하기 위해 사용될 수 있으며, 이는 그 다음 비-상동성 말단 연결(NHEJ), 상동-지향된 복구(HDR, 예를 들어, HTT 엑손의 전체 또는 일부를 대체하기 위한 공여자 주형의 삽입을 포함할 수 있음), 상동-독립적 표적화된 통합(HITI), 미세-상동 매개된 말단 연결(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 복구(BER)에 의해 편집된다.
개시내용의 gNA 변이체는 참조 gNA에 비해 증진된 또는 다양한 특성을 갖는 하나 이상의 gNA 변이체를 생성하기 위해 깊은 돌연변이 진화(DME)(본 명세서에 참고로 포함된 미국 특허 출원 일련 번호 PCT/US20/36506에 기재된 바와 같음), 깊은 돌연변이 스캐닝(DMS), 오류 경향의 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있는 다수의 돌연변이유발 방법에 의해 설계 및 생성될 수 있다. 참조 gNA의 활성은 gNA 변이체의 활성이 비교되는 벤치마크로 사용될 수 있으며, 이에 의해 gNA 변이체의 기능 또는 기타 특성에서 개선을 측정할 수 있다. 다른 실시형태에서, 참조 gNA는 gNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해 하나 이상의 의도적인 표적화된 돌연변이를 받을 수 있다.
개시내용의 gNA는 2개의 세그먼트인: 표적화 서열 및 단백질-결합 세그먼트을 포함한다. gNA의 표적화 세그먼트는 아래에 더 자세히 기술된, 표적 핵산 서열(예를 들어, 표적 ssRNA, 표적 ssDNA, 이중 가닥 표적 DNA의 가닥 등) 내의 특정 서열(표적 부위)에 상보적인(따라서 이와 혼성화하는) 뉴클레오티드 서열(가이드 서열, 스페이서, 표적자 또는 표적화 서열로 상호교환가능하게 지칭됨)을 포함한다. gNA의 표적화 서열은 코딩 서열, 코딩 서열의 상보체, 비-코딩 서열을 포함하는 표적 핵산 서열, 및 조절 요소에 결합할 수 있다. 단백질-결합 세그먼트(또는 "활성화제" 또는 "단백질-결합 서열")는 복합체로서 CasX 단백질과 상호작용(예를 들어, 결합)하여, RNP를 형성한다(아래에 더 자세히 기술됨). 단백질-결합 세그먼트는 대안적으로 본 명세서에서 "스캐폴드"로 지칭되며, 이는 아래에서 더 자세히 기술되는 여러 영역으로 구성된다.
이중 가이드 RNA(dgRNA)의 경우, 표적자 및 활성화제 부분은 각각 이중체-형성 세그먼트을 가지며, 여기서 표적자의 이중체 형성 세그먼트와 활성화제의 이중체-형성 세그먼트는 서로 상보성을 갖고 서로 혼성화하여 이중 가닥 이중체(gRNA의 경우 dsRNA 이중체)를 형성한다. gNA가 gRNA인 경우, 용어 "표적자" 또는 "표적자 RNA"는 본 명세서에서 CasX 이중 가이드 RNA의 crRNA-유사 분자(crRNA: "CRISPR RNA")(따라서 "활성화제"와 "표적자"가, 예를 들어, 개재 뉴클레오티드에 의해 함께 연결된 경우 CasX 단일 가이드 RNA의 것)를 지칭하기 위해 사용된다. crRNA는 tracrRNA와 이어지는 표적화 서열의 뉴클레오티드로 어닐링하는 5' 영역을 가진다. 따라서, 예를 들어, 가이드 RNA(dgRNA 또는 sgRNA)는 가이드 서열 및 crRNA 반복으로도 지칭될 수 있는 crRNA의 이중체-형성 세그먼트를 포함한다. 상응하는 tracrRNA-유사 분자(활성화제)는 또한 가이드 RNA의 단백질-결합 세그먼트의 dsRNA 이중체의 나머지 절반을 형성하는 뉴클레오티드의 이중체-형성 스트레치를 포함한다. 따라서, 표적자 및 활성화제는 상응하는 쌍으로서 혼성화하여 이중 가이드 NA를 형성하며, 이는 본 명세서에서 "이중 가이드 NA", "이중-분자 gNA", "dgNA", "이중-분자 가이드 NA" 또는 "2-분자 가이드 NA"로 지칭된다. CasX 단백질에 의한 표적 핵산 서열(예를 들어, 게놈 DNA)의 부위-특이적 결합 및/또는 절단은 gNA의 표적화 서열과 표적 핵산 서열 사이의 염기-쌍 상보성에 의해 결정된 하나 이상의 위치(예를 들어, 표적 핵산의 서열)에서 일어날 수 있다. 따라서, 예를 들어, 개시내용의 gNA는 TC PAM 모티프 또는 PAM 서열, 예컨대 ATC, CTC, GTC, 또는 TTC에 상보적인 서열에 인접한 표적 핵산에 대해 상보성인 서열을 갖고 따라서 이와 혼성화할 수 있다. 가이드 서열의 표적화 서열은 표적 핵산 서열의 서열과 혼성화되기 때문에, PAM 서열의 위치를 고려하는 한, 표적자는 특정 표적 핵산 서열과 혼성화하도록 사용자에 의해 변형될 수 있다. 따라서, 일부 경우에 표적자의 서열이 비-자연적으로 발생하는 서열일 수 있다. 다른 경우에, 표적자의 서열은 편집될 유전자로부터 유래된 자연적으로-발생하는 서열일 수 있다. 다른 실시형태에서, gNA의 활성화제 및 표적자는 (서로 혼성화하기 보다는) 서로 공유적으로 연결되고 본 명세서에서 "단일-분자 gNA", "일-분자 가이드 NA", "단일 가이드 NA", "단일 가이드 RNA", "단일-분자 가이드 RNA", "일-분자 가이드 RNA", "단일 가이드 DNA", "단일-분자 DNA" 또는 "일-분자 가이드 DNA", ("sgNA", "sgRNA" 또는 "sgDNA")로 지칭되는 단일 분자를 포함한다. 일부 실시형태에서, sgNA는 "활성화제" 또는 "표적자"를 포함하고 따라서 각각 "활성화제-RNA" 및 "표적자-RNA"일 수 있다.
집합적으로, 개시내용의 어셈블리된 gNA는 4개의 별도 영역 또는 도메인을 포함한다: 개시내용의 실시형태에서 표적 핵산에 특이적이고 gNA의 3' 말단에 위치한 RNA 삼중체, 스캐폴드 줄기, 연장된 줄기, 및 표적화 서열. RNA 삼중체, 스캐폴드 줄기, 연장된 줄기는 함께 gNA의 "스캐폴드"로 지칭된다.
i. RNA 삼중체
본 명세서에 제공된 가이드 NA(참조 sgNA 포함)의 일부 실시형태에서, RNA-삼중체가 있고, RNA 삼중체는 2개의 개재하는 줄기 고리(스캐폴드 줄기 고리 및 연장된 줄기 고리) 후에 AAAG로 종료하는 UUU--nX(~4-15)--UUU 줄기 고리( 서열번호: 189)를 포함하여, 삼중체를 지나 이중체 가매듭으로 연장될 수 있는 가매듭을 형성한다. 삼중체의 UU-UUU-AAA 서열은 스페이서, 스캐폴드 줄기 및 연장된 줄기 사이의 넥서스로 형성된다. 예시적인 참조 CasX sgNA에서, UUU-고리-UUU 영역은 먼저 코딩된 다음 스캐폴드 줄기 고리에 대해 코딩되고 그 다음 연장된 줄기 고리에 대해 코딩되며, 이는 사중고리에 의해 연결된 다음 AAAG가 스페이서가 되기 전에 삼중체를 닫는다.
j. 스캐폴드 줄기 고리
개시내용의 CasX sgNA의 일부 실시형태에서, 삼중체 영역은 스캐폴드 줄기 고리가 뒤따른다. 스캐폴드 줄기 고리는 CasX 단백질(예컨대 참조 또는 CasX 변이체 단백질)에 의해 결합되는 gNA의 영역이다. 일부 실시형태에서, 스캐폴드 줄기 고리는 상당히 짧고 안정적인 줄기 고리이다. 일부 경우에, 스캐폴드 줄기 고리가 많은 변화를 용인하지 않고 일부 형태의 RNA 버블을 요한다. 일부 실시형태에서, 스캐폴드 줄기는 CasX sgNA 기능에 필요하다. 중요한 줄기 고리인 Cas9의 넥서스 줄기와 유사할 수 있지만, 일부 실시형태에서 CasX sgNA의 스캐폴드 줄기는 CRISPR/Cas 시스템에서 발견되는 다른 많은 줄기 고리와 상이한 필요한 돌출부(RNA 버블)를 갖는다. 일부 실시형태에서, 이 돌출부의 존재는 상이한 CasX 단백질과 상호작용하는 sgNA에 걸쳐 보존된다. gNA의 스캐폴드 줄기 고리 서열을 인코딩하는 예시적인 서열은 서열 CCAGCGACTATGTTCGTATGG(서열번호: 190)를 포함한다. 다른 실시형태에서, 개시내용은 스캐폴드 줄기 고리가, 일부 경우에 숙주 세포 핵 밖으로 이송을 촉진하기 위해 사용될 수 있는, MS2, Qβ, U1 헤어핀 II, Uvsx 또는 PP7 줄기 고리로 지정된 줄기 고리 서열과 같으나 이에 제한되지 않는 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 대체된 gNA 변이체를 제공한다. 일부 경우에, gNA의 이종성 RNA 줄기 고리는 단백질, RNA 구조, DNA 서열 또는 소분자에 결합할 수 있어 CasX에 대한 gNA의 결합을 촉진할 수 있다.
k. 연장된 줄기 고리
개시내용의 sgNA의 일부 실시형태에서, 스캐폴드 줄기 고리에 연장된 줄기 고리가 이어진다. 일부 실시형태에서, 연장된 줄기는 CasX 단백질에 의해 크게 결합되지 않은 합성 tracr 및 crRNA 융합체를 포함한다. 일부 실시형태에서, 연장된 줄기 고리는 고도로 가단성일 수 있다. 일부 실시형태에서, 단일 가이드 gRNA는 연장된 줄기 고리에서 tracr 및 crRNA 사이에 GAAA 사중고리 링커 또는 GAGAAA 링커로 만들어진다. 일부 경우에, CasX sgNA의 표적자 및 활성화제는 개재하는 뉴클레오티드에 의해 서로 연결되고 링커는 3 내지 20개 뉴클레오티드의 길이를 가질 수 있다. 개시내용의 CasX sgNA의 일부 실시형태에서, 연장된 줄기는 리보핵단백질 복합체에서 CasX 단백질의 외부에 위치하는 큰 32-bp 고리이다. sgNA의 연장된 줄기 고리 서열을 인코딩하는 예시적인 서열은 GCGCTTATTTATCGGAGAGAAATCCGATAAATAAGAAGC(서열번호: 191)를 포함한다. 일부 실시형태에서, 연장된 줄기 고리는 GAGAAA 스페이서 서열을 포함한다. 일부 실시형태에서, 개시내용은 연장된 줄기 고리가 MS2, Qβ, U1 헤어핀 II, Uvsx 또는 PP7 줄기 고리로 지정된 줄기 고리 서열과 같으나 이에 제한되지 않는 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 대체된 gNA 변이체를 제공한다. 이러한 경우에, 이종성 RNA 줄기 고리는 gNA의 안정성을 증가시킨다. 다른 실시형태에서, 개시내용은 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000 뉴클레오티드, 또는 적어도 10-10,000, 적어도 10-1000, 또는 적어도 10-100 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 갖는 gNA 변이체를 제공한다. 일부 실시형태에서, 연장된 줄기 고리는 GAGAAA 스페이서 서열을 포함한다.
l. 표적화 서열(스페이서라고도 함)
XDP 시스템에서 이용되는 개시내용의 gNA의 일부 실시형태에서, 연장된 줄기 고리가 삼중체의 일부를 형성하는 영역과 그 다음 gNA의 3' 말단에서 표적화 서열(또는 "스페이서")에 이어진다. 표적화 서열은 변형되어 지는 유전자의 표적 핵산 서열의 특정 영역에 CasX 리보핵단백질 홀로 복합체를 표적화한다. 따라서, 예를 들어, 개시내용의 gNA 표적화 서열은 TC PAM 모티프 또는 PAM 서열 TTC, ATC, GTC 또는 CTC 중 임의의 하나가 표적 서열에 상보적인 비-표적 가닥 서열에 대해 1 뉴클레오티드 5'에 위치되는 경우 RNP의 성분으로서 진핵 세포에서 핵산(예를 들어, 진핵 염색체, 염색체 서열, 진핵 RNA, 등)에서의 HTT 유전자의 일부에 서열 상보성을 가지고, 따라서 이들에 혼성화할 수 있다. gNA의 표적화 서열은 PAM 서열 위치가 고려되는 한, gNA가 임의의 원하는 표적 핵산 서열의 원하는 서열을 표적화할 수 있도록 변형될 수 있다. 일부 실시형태에서, gNA 스캐폴드는 표적화 서열의 5'이고, 표적화 서열은 gNA의 3' 말단 상에 있다. 일부 실시형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 모티프 서열은 TC이다. 다른 실시형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 서열은 NTC이다.
일부 실시형태에서, XDP 시스템의 gNA는 (a) i) 야생형 서열일 수 있거나 하나 이상의 돌연변이를 포함할 수 있는 표적 단백질 또는 ii) 야생형 서열일 수 있는 단백질의 조절 요소를 코딩하는 핵산 서열에 상보적이거나; 또는 (b) 하나 이상의 돌연변이를 포함할 수 있는 단백질 또는 이의 조절 요소를 인코딩하는 핵산 서열의 상보체에 상보적인 표적화 서열을 포함한다. 일부 실시형태에서, gNA의 표적화 서열은 하나 이상의 돌연변이를 포함하는 표적 단백질을 인코딩하는 유전자의 일부에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 엑손에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 인트론에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 인트론-엑손 접합부에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 또는 그의 보체의 하나 이상의 단일 뉴클레오티드 다형성(SNP)을 포함하는 서열에 상보적이다. 다른 실시형태에서, gNA의 표적화 서열은 표적 유전자의 유전자간 영역의 서열 또는 표적 유전자의 유전자간 영역에 상보적인 서열에 상보적이다.
일부 실시형태에서, gNA의 표적화 서열은 표적 유전자의 발현을 조절하는 조절 요소에 특이적이다. 이러한 조절 요소는 프로모터 영역, 인핸서 영역, 유전자간 영역, 5' 비번역된 영역(5' UTR), 3' 비번역된 영역(3' UTR), 유전자간 영역, 유전자 인핸서 요소, 보존된 요소 및 시스-조절 요소를 포함하는 영역을 포함하지만 이에 제한되지 않는다. 프로모터 영역은 표적 유전자 개시점의 5kb 이내의 뉴클레오티드를 포괄하도록 의도되거나, 유전자 인핸서 요소 또는 보존된 요소의 경우 표적 유전자에 대해 1Mb 이상 원위일 수 있다. 일부 실시형태에서, 개시내용은 표적 유전자 조절 요소와 혼성화하는 표적화 서열을 갖는 gNA를 제공한다. 전기한 것에서 표적은 돌연변이를 포함하는 표적 단백질이 발현되지 않거나 세포에서 더 낮은 수준으로 발현되도록 표적의 인코딩 유전자가 녹아웃 또는 녹다운되도록 의도된 것들이다. 일부 실시형태에서, 개시내용은 gNA의 표적화 서열(또는 스페이서)이 표적 단백질, 표적 단백질의 일부, 조절 요소의 일부, 또는 표적 유전자에 대한 유전자 또는 조절 요소의 일부의 상보체를 인코딩하는 핵산 서열에 상보적인 CasX:gNA 시스템을 제공한다. 일부 실시형태에서, 표적화 서열은 14 내지 35개 연속적인 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 18, 18, 19, 20, 21, 22, 23 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 연속적인 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 20개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 19개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 18개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 17개 연속적인 뉴클레오티드로 이루어진다. 일부 실시형태에서, 표적화 서열은 16개 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 15개 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 연속적인 뉴클레오티드를 가지고 표적화 서열은 표적 핵산 서열에 대해 0 내지 5, 0 내지 4, 0 내지 3, 또는 0 내지 2개 미스매치를 포함할 수 있고 표적화 서열을 포함하는 gNA를 포함하는 RNP가 표적 핵산에 대하여 상보적 결합을 형성할 수 있도록 충분한 결합 특이성을 유지할 수 있다.
일부 실시형태에서, XDP 시스템의 CasX:gNA는 제1 gNA를 포함하고 제2 (및 선택적으로 제3, 제4 또는 제5) gNA를 추가로 포함하며, 여기서 제2 gNA는 제1 gNA의 표적화 서열과 비교하여 표적 핵산 또는 이의 상보체의 상이한 부분에 상보적인 표적화 서열을 갖는다. gNA의 표적화 서열의 선택에 의해, 표적 핵산의 정의된 영역이 본 명세서에 기재된 CasX:gNA 시스템을 사용하여 변형되거나 편집될 수 있다.
m. gNA 스캐폴드
표적화 서열 영역의 제외로, gNA의 나머지 영역은 본 명세서에서 스캐폴드로 지칭된다. 일부 실시형태에서, gNA 스캐폴드는 하기에 참조 gNA로 기재된 자연적으로-발생하는 서열로부터 유래된다. 다른 실시형태에서, gNA 스캐폴드는 gNA 변이체에 바람직한 특성을 부여하기 위해 돌연변이, 삽입, 결실 또는 도메인 치환이 도입된 참조 gNA의 변이체이다.
일부 실시형태에서, 참조 gRNA는 델타프로테오박테리아로부터 단리되거나 유래된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 델타프로테오박테리아로부터 단리되거나 유래된 예시적인 CasX 참조 tracrRNA 서열은 다음을 포함할 수 있다:
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA (서열번호: 6) 및
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG (서열번호: 7). 델타프로테오박테리아로부터 단리되거나 유래된 예시적인 crRNA 서열은 CCGAUAAGUAAAACGCAUCAAAG (서열번호: 194)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 gNA는 델타프로테오박테리아로부터 단리되거나 유래된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다. 일부 실시형태에서, 참조 가이드 RNA는 플랑크토마이세테스로부터 단리되거나 유도된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 플랑크토마이세테스로부터 단리되거나 유도된 예시적인 참조 tracrRNA 서열은 다음을 포함할 수 있다:
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(서열번호: 8) 및
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(서열번호: 9). 플랑크토마이세테스로부터 단리되거나 유도된 예시적인 crRNA 서열은 UCUCCGAUAAAUAAGAAGCAUCAAAG(서열번호: 197)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 gNA는 플랑크토마이세테스로부터 단리되거나 유래된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다.
일부 실시형태에서, 참조 gNA는 칸디다투스 성박테리아로부터 단리되거나 유도된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 칸디다투스 성박테리아로부터 단리되거나 유도된 예시적인 CasX 참조 tracrRNA 서열은: GUUUACACACUCCCUCUCAUAGGGU(서열번호: 10), GUUUACACACUCCCUCUCAUGAGGU(서열번호: 11), UUUUACAUACCCCCUCUCAUGGGAU(서열번호: 12) 및 GUUUACACACUCCCUCUCAUGGGGG(서열번호: 13)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 가이드 RNA는 칸디다투스 성박테리아로부터 단리되거나 유도된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다.
표 2는 참조 gRNA tracr, cr 및 스캐폴드 서열의 서열을 제공한다. 일부 실시형태에서, 개시내용은 gNA가 표 2의 서열번호: 4-16 중 임의의 하나의 서열을 갖는 참조 gNA 서열에 비해 적어도 하나의 뉴클레오티드 변형을 갖는 서열을 포함하는 스캐폴드를 갖는 gNA 서열을 제공한다. 벡터가 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA 및 DNA의 키메라인 이들 실시형태에서, 티민(T) 염기가 표 2 및 표 3의 서열을 포함하여 본 명세서에 기재된 임의의 gNA 서열 실시형태의 우라실(U) 염기를 대체할 수 있다는 것이 이해될 것이다.
[표 2]. 참조 gRNA tracr 및 스캐폴드 서열
Figure pct00034
n. gNA 변이체
또 다른 양태에서, 개시내용은 참조 gRNA 스캐폴드에 비해 하나 이상의 변형을 포함하는 가이드 핵산 변이체(본 명세서에서 대안적으로 "gNA 변이체" 또는 핵산 변이체가 RNA를 포함하는 경우 "gRNA 변이체"로 지칭됨)에 관한 것이다. 본 명세서에 사용된 "스캐폴드"는 스페이서 서열을 제외하고 gNA 기능에 필요한 gNA에 대한 모든 부분을 지칭한다.
일부 실시형태에서, gNA 변이체는 개시내용의 참조 gRNA 서열에 비해 하나 이상의 뉴클레오티드 치환, 삽입, 결실, 또는 교환되거나 대체된 영역을 포함한다. 일부 실시형태에서, 돌연변이는 참조 gRNA의 임의의 영역에서 발생하여 gNA 변이체를 생성할 수 있다. 일부 실시형태에서, gNA 변이체 서열의 스캐폴드는 서열번호: 4 또는 서열번호: 5의 서열에 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 적어도 80%, 적어도 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는다.
일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 특성을 개선하는 참조 gRNA의 하나 이상의 영역 내에 하나 이상의 뉴클레오티드 변화를 포함한다. 예시적인 영역은 RNA 삼중체, 가매듭, 스캐폴드 줄기 고리 및 연장된 줄기 고리를 포함한다. 일부 경우에, 변이체 스캐폴드 줄기는 버블을 추가로 포함한다. 다른 경우에, 변이체 스캐폴드는 삼중체 고리 영역을 추가로 포함한다. 또 다른 경우에, 변이체 스캐폴드는 5' 비구조화 영역을 추가로 포함한다. 일 실시형태에서, gNA 변이체 스캐폴드는 서열번호: 14에 적어도 60% 서열 동일성을 갖는 스캐폴드 줄기 고리를 포함한다. 또 다른 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202)의 서열을 갖는 스캐폴드 줄기 고리를 포함한다. 또 다른 실시형태에서, 개시내용은 서열번호: 5에 비해 C18G 치환, G55 삽입, U1 결실, 및 원래의 6 nt 고리 및 13 최다-고리-근위 염기쌍(총 32개 뉴클레오티드)은 Uvsx 헤어핀(4 nt 고리 및 5 고리-근위 염기쌍; 총 14개 뉴클레오티드)에 의해 대체되고 연장된 줄기의 고리-원위 염기는 A99의 결실 및 G64U의 치환에 의해 새로운 Uvsx 헤어핀과 인접한 완전하게 염기-쌍을 이루는 줄기로 전환된, 변형된 연장된 줄기 고리를 포함하는 gNA 스캐폴드를 제공한다. 전기한 실시형태에서, gNA 스캐폴드는 서열 ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUGGGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(서열번호 734)를 포함한다.
변이체 gNA가 본 명세서에 기재된 참조 gRNA와 비교할 때 하나 이상의 개선된 기능 또는 특징을 갖거나, 하나 이상의 새로운 기능을 추가하는 모든 gNA 변이체는 개시내용의 범주 내인 것으로 고려된다. 이러한 gNA 변이체의 대표적인 예는 가이드 174(서열번호: 734)이다. 일부 실시형태에서, gNA 변이체는 gNA 변이체를 포함하는 RNP에 새로운 기능을 추가한다. 일부 실시형태에서, gNA 변이체는 개선된 안정성; 개선된 용해도; gNA의 개선된 전사; 뉴클레아제 활성에 대한 개선된 내성; gNA의 증가된 접힘율; 접힘 동안 부산물 형성 감소; 증가된 생산적인 접힘; CasX 단백질에 대한 개선된 결합 친화성; CasX 단백질과 복합화될 때 표적 DNA에 대한 개선된 결합 친화성; CasX 단백질과 복합화될 때 개선된 유전자 편집; CasX 단백질과 복합화될 때 개선된 편집의 특이성; 및 CasX 단백질과 복합화될 때 표적 DNA의 편집에서 ATC, CTC, GTC 또는 TTC를 포함하는 하나 이상의 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력 또는 이의 임의의 조합으로부터 선택된 개선된 특성을 갖는다. 일부 경우에, gNA 변이체의 개선된 특성 중 하나 이상은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 적어도 약 1.1 내지 약 100,000-배 개선된다. 다른 경우에, gNA 변이체의 하나 이상의 개선된 특성은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000-배 이상 개선된다. 다른 경우에, gNA 변이체의 개선된 특징 중 하나 이상은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 약 1.1 내지 100,000-배, 약 1.1 내지 10,000-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,000-배, 약 100 내지 10,000-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,000-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선되었다. 다른 경우에, gNA 변이체의 하나 이상의 개선된 특성은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 약 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배 , 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선되었다.
일부 실시형태에서, gNA 변이체는 개시내용의 gNA 변이체를 생성하기 위해, 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 경향있는 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있는, 하기 본 명세서에 기술된 돌연변이유발 방법과 같은, 하나 이상의 돌연변이유발 방법에 참조 gRNA를 적용함에 의해 생성될 수 있다. 참조 gRNA의 활성은 gNA 변이체의 활성을 비교함에 의해 gNA 변이체의 기능에서 개선을 측정하는 벤치마크로 사용될 수 있다. 다른 실시형태에서, 참조 gRNA는 gNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해 하나 이상의 의도적 표적화된 돌연변이, 치환 또는 도메인 교환을 거칠 수 있다. 이러한 방법에 의해 생성된 예시적인 gRNA 변이체는 실시예에 기재되어 있고 gNA 스캐폴드의 대표적인 서열은 표 3에 제시되어 있다.
일부 실시형태에서, gNA 변이체는 참조 가이드 핵산 스캐폴드 서열과 비교하여 하나 이상의 변형을 포함하며, 여기서 하나 이상의 변형은 gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 치환; gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 결실; gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 삽입; gNA 변이체의 영역의 전부 또는 일부의 치환; gNA 변이체의 영역의 전부 또는 일부의 결실; 또는 전기한 것의 임의의 조합으로부터 선택된다. 일부 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 15개 연속적인 또는 비-연속적인 뉴클레오티드의 치환이다. 다른 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 결실이다. 다른 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입이다. 다른 경우에, 변형은 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 스캐폴드 줄기 고리 또는 연장된 줄기 고리의 치환이다. 일부 경우에, 개시내용의 gNA 변이체는 한 영역에서 2개 이상의 변형을 포함한다. 다른 경우에, 개시내용의 gNA 변이체는 2개 이상의 영역에서의 변형을 포함한다. 다른 경우에, gNA 변이체는 이 단락에 기술된 전기한 변형의 임의의 조합을 포함한다.
일부 실시형태에서, U6 프로모터로부터의 전사가 +1 뉴클레오티드가 G일 때 시작 부위와 관련하여 보다 효율적이고 보다 일관성이 있기 때문에, 5' G는 생체내 발현을 위해 gNA 변이체 서열에 추가된다. 다른 실시형태에서, T7 폴리머라제가 +1 위치에서 G 및 +2 위치에서 퓨린을 강력하게 선호하기 때문에, 2개의 5' G가 시험관내 전사를 위해 gNA 변이체 서열에 첨가되어 생산 효율을 증가시킨다. 일부 경우에, 5' G 염기는 표 2의 참조 스캐폴드에 추가된다. 다른 경우에, 5' G 염기는 표 3의 변형체 스캐폴드에 추가된다.
표 3은 개시내용의 예시적인 gNA 변이체 스캐폴드 서열을 제공한다. 표 3에서 (-)는 서열번호: 5의 참조 서열에 비해 특정된 위치(들)의 결실을 나타내고, (+)는 서열번호: 5에 비해 표시된 위치에서 특정된 염기(들)의 삽입을 나타내고, (:)는 서열번호: 5에 비해 결실 또는 치환의 특정된 시작:정지 좌표에서 염기의 범위를 나타내고, 다중 삽입, 결실 또는 치환은 콤마에 의해 분리된다; 예를 들어, A14C, T17G. 일부 실시형태에서, gNA 변이체 스캐폴드는 표 3에 열거된 서열, 또는 서열번호: 597-781, 또는 이들에 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 서열 동일성을 갖는 서열 중 임의의 하나를 포함한다. 벡터가 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA 및 DNA의 키메라인 이들 실시형태에서, 티민(T) 염기가 본 명세서에 기재된 임의의 gNA 서열 실시형태의 우라실(U) 염기를 대체할 수 있음이 이해될 것이다.
[표 3]. 예시적인 gNA 변이체 스캐폴드 서열
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
일부 실시형태에서, gNA 변이체는 서열 -UUU-N4-25UUU-(서열번호: 203)를 포함하는 tracrRNA 줄기 고리를 포함한다. 예를 들어, gNA 변이체는 삼중체 영역에 기여하는 2개의 삼중항 U 모티프에 의해 측접되는 스캐폴드 줄기 고리 또는 이의 대체를 포함한다. 일부 실시형태에서, 스캐폴드 줄기 고리 또는 이들의 대체는 적어도 4개 뉴클레오티드, 적어도 5개 뉴클레오티드, 적어도 6개 뉴클레오티드, 적어도 7개 뉴클레오티드, 적어도 7개 뉴클레오티드, 적어도 8개 뉴클레오티드, 적어도 9개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 11개 뉴클레오티드, 적어도 12개 뉴클레오티드, 적어도 13개 뉴클레오티드, 적어도 14개 뉴클레오티드, 적어도 15개 뉴클레오티드, 적어도 16개 뉴클레오티드, 적어도 17개 뉴클레오티드, 적어도 18개 뉴클레오티드, 적어도 19개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 21개 뉴클레오티드, 적어도 22개 뉴클레오티드, 적어도 23개 뉴클레오티드, 적어도 24개 뉴클레오티드, 또는 적어도 25개 뉴클레오티드를 포함한다.
일부 실시형태에서, gNA 변이체는 스페이서 영역에 대해 5' 위치에 -AAAG-를 갖는 crRNA 서열을 포함한다. 일부 실시형태에서, -AAAG- 서열은 스페이서 영역에 대해 바로 5'이다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 참조 gRNA에 비해 CasX 변이체 gNA에서 적어도 하나의 뉴클레오티드 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 또는 비-연속적인 뉴클레오티드의 결실을 포함한다. 일부 실시형태에서, 적어도 하나의 결실은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 뉴클레오티드 결실을 포함하고 결실은 연속적인 뉴클레오티드에 있지 않는다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 결실이 있는 이들 실시형태에서, 본 명세서에 기재된 바와 같은 임의의 결실 길이, 및 임의의 결실 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개 뉴클레오티드의 제1 결실, 및 2개 뉴클레오티드의 제2 결실을 포함할 수 있고, 2개 결실은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에서 적어도 2개의 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 결실을 포함한다. 예를 들어, 영역은 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA에서 임의의 뉴클레오티드의 임의의 결실은 개시내용의 범주 내인 것으로 고려된다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 적어도 하나의 뉴클레오티드 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입을 포함한다. 일부 실시형태에서, 적어도 하나의 뉴클레오티드 삽입은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2개 이상의 삽입을 포함하고, 삽입은 연속적이지 않다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 삽입이 있는 실시형태에서, 본 명세서에 기재된 바와 같은 임의의 삽입 길이, 및 임의의 삽입 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개의 뉴클레오티드의 제1 삽입, 및 2개의 뉴클레오티드의 제2 삽입을 포함할 수 있고 2개의 삽입은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에 적어도 2개의 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 삽입을 포함한다. 예를 들어, 영역은 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA의 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T) 또는 이의 조합의 임의의 삽입은 개시내용의 범위 내인 것으로 고려된다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 적어도 하나의 핵산 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 또는 비-연속적인 치환된 뉴클레오티드를 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1-4 뉴클레오티드 치환을 포함한다. 일부 실시형태에서, 적어도 하나의 치환은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2 이상의 치환을 포함하고, 치환은 연속적이지 않다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 치환이 있는 이들 실시형태에서, 본 명세서에 기재된 바와 같은, 임의의 치환된 뉴클레오티드 길이, 및 임의의 치환된 뉴클레오티드 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개의 뉴클레오티드의 제1 치환을 포함할 수 있고, 2개의 뉴클레오티드의 제2 치환 및 2개의 치환은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에 적어도 2개의 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 치환을 포함한다. 예를 들어, 영역은 삼중체, 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체, 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA의 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T) 또는 이의 조합의 임의의 치환은 개시내용의 범위 내인 것으로 고려된다.
본 명세서에 기재된 임의의 치환, 삽입 및 결실을 조합하여 개시내용의 gNA 변이체를 생성할 수 있다. 예를 들어, gNA 변이체는 참조 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 참조 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 참조 gRNA에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 참조 gRNA에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
일부 실시형태에서, gNA 변이체는 서열번호: 4-16 중 임의의 하나에 적어도 20% 동일, 적어도 30% 동일, 적어도 40% 동일, 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 스캐폴드 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 4-16 중 임의의 하나에 적어도 60% 상동성(또는 동일한) 스캐폴드 영역을 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 14에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 tracr 줄기 고리를 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 14에 적어도 60% 상동성(또는 동일한) tracr 줄기 고리를 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 15에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 연장된 줄기 고리를 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 15에 적어도 60% 상동성(또는 동일한) 연장된 줄기 고리를 포함한다.
일부 실시형태에서, gNA 변이체는 다음과 같이 기술된 참조 gNA와 이러한 차이점을 갖는 외인성 연장된 줄기 고리를 포함한다. 일부 실시형태에서, 외인성 연장된 줄기 고리는 본 명세서에 개시된 참조 줄기 고리 영역(예를 들어, 서열번호: 15)에 대한 동일성이 거의 또는 전혀 없다. 일부 실시형태에서, 외인성 줄기 고리는 적어도 10bp, 적어도 20bp, 적어도 30bp, 적어도 40bp, 적어도 50bp, 적어도 60bp, 적어도 70bp, 적어도 80bp, 적어도 90bp, 적어도 100bp, 적어도 200bp, 적어도 300bp, 적어도 400bp, 적어도 500bp, 적어도 600bp, 적어도 700bp, 적어도 800bp, 적어도 900bp, 적어도 1,000bp, 적어도 2,000bp, 적어도 3,000bp, 적어도 4,000bp, 적어도 5,000bp, 적어도 6,000bp, 적어도 7,000bp, 적어도 8,000bp, 적어도 9,000bp, 적어도 10,000bp, 적어도 12,000bp, 적어도 15,000bp 또는 적어도 20,000bp이다. 일부 실시형태에서, gNA 변이체는 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, 이종성 줄기 고리는 gNA의 안정성을 증가시킨다. 일부 실시형태에서, 이종성 RNA 줄기 고리는 단백질, RNA 구조, DNA 서열, 또는 소분자에 결합할 수 있다. 일부 실시형태에서, 외인성 줄기 고리 영역은 RNA 줄기 고리 또는 헤어핀, 예를 들어 열안정성 RNA 예컨대 MS2(ACAUGAGGAUUACCCAUGU(서열번호: 204)), Qβ (UGCAUGUCUAAGACAGCA(서열번호: 205)), U1 헤어핀 II (AAUCCAUUGCACUCCGGAUU(서열번호: 206)), Uvsx (CCUCUUCGGAGG(서열번호: 207)), PP7 (AGGAGUUUCUAUGGAAACCCU(서열번호: 208)), 파지 복제 루프 고리 (AGGUGGGACGACCUCUCGGUCGUCCUAUCU(서열번호: 209)), 키싱 고리_a (UGCUCGCUCCGUUCGAGCA(서열번호: 210)), 키싱 고리_b1 (UGCUCGACGCGUCCUCGAGCA(서열번호: 211)), 키싱 고리_b2 (UGCUCGUUUGCGGCUACGAGCA(서열번호: 212)), G 사중체 M3q (AGGGAGGGAGGGAGAGG(서열번호: 213)), G 사중체 텔로미어 바스켓 (GGUUAGGGUUAGGGUUAGG(서열번호: 214)), 사르신-리신 고리 (CUGCUCAGUACGAGAGGAACCGCAG(서열번호: 215)) 또는 가매듭 (UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGAGUUUUAAAAUGUCUCUAAGUACA(서열번호: 216))을 포함한다. 일부 실시형태에서, 외인성 줄기 고리는 긴 비-코딩 RNA(lncRNA)를 포함한다. 본 명세서에 사용된 바와 같이, lncRNA는 길이가 대략 200bp보다 긴 비-코딩 RNA를 지칭한다. 일부 실시형태에서, 외인성 줄기 고리의 5' 및 3' 말단은 염기쌍을 이루고; 즉, 이중체 RNA의 영역을 형성하기 위해 상호작용한다. 일부 실시형태에서, 외인성 줄기 고리의 5' 및 3' 말단은 염기쌍을 이루고, 외인성 줄기 고리의 5' 및 3' 말단 사이의 하나 이상의 영역은 염기쌍을 이루지 않는다. 일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 (a) 하나 이상의 영역에서 gNA 변이체에서 1 내지 15개 연속적인 또는 비-연속적인 뉴클레오티드의 치환; (b) 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 결실; (c) 하나 이상의 영역에서 gNA 변이체의 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입; (d) 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 스캐폴드 줄기 고리 또는 연장된 줄기 고리의 치환; 또는 (a)-(d)의 임의의 조합을 포함한다.
일부 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202)의 스캐폴드 줄기 고리 서열을 포함한다. 일부 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202) 및 이에 대한 적어도 1, 2, 3, 4 또는 5개 미스매치의 스캐폴드 줄기 고리 서열을 포함한다.
일부 실시형태에서, gNA 변이체는 32개 미만의 뉴클레오티드, 31개 미만의 뉴클레오티드, 30개 미만의 뉴클레오티드, 29개 미만의 뉴클레오티드, 28개 미만의 뉴클레오티드, 27개 미만의 뉴클레오티드, 26개 미만의 뉴클레오티드. 뉴클레오티드, 25개 미만의 뉴클레오티드, 24개 미만의 뉴클레오티드, 23개 미만의 뉴클레오티드, 22개 미만의 뉴클레오티드, 21개 미만의 뉴클레오티드, 또는 20개 미만의 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 32개 미만의 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 열안정성 줄기 고리를 추가로 포함한다.
일부 실시형태에서, gNA는 RNA 결합 도메인을 포함한다. RNA 결합 도메인은 gNA 안으로 삽입된 레트로바이러스 Psi 패키징 요소일 수 있거나 CasX에 대한 gNA의 결합을 용이하게 할 수 있는 MS2, PP7, Q베타, U1A 또는 파지 R-고리로 구성된 군으로부터 선택된 단백질에 친화성을 갖는 줄기 고리이다. CasX 내로 통합된 단백질 구조에 친화성을 갖는 유사한 RNA 구성요소는 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭을 포함한다. 가이드 RNA 안으로 삽입된 Psi 패키징 요소의 통합은 부분적으로 Gag NC 단백질에 대한 Psi 서열의 높은 친화성 결합으로 인해 XDP 입자의 패키징을 용이하게 한다는 것이 발견되었다. 더욱이, RNP를 초래하는, gNA에 대한 CasX의 친화성으로 인해, XDP 내로 RNP의 통합이 더욱 용이하게 된다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열을 포함한다. 일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열 및 표적화 서열을 포함한다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 600, 서열번호: 602, 서열번호: 659, 서열번호: 603, 서열번호: 660, 서열번호: 661, 서열번호: 662, 서열번호: 599, 서열번호: 663, 서열번호: 601, 서열번호: 604, 서열번호: 608, 서열번호: 656, 서열번호: 666, 서열번호: 610, 서열번호: 667, 서열번호: 608, 서열번호: 669, 서열번호: 598, 서열번호: 670, 서열번호: 671, 서열번호: 605, 서열번호: 672, 서열번호: 734, 서열번호: 735, 서열번호: 736, 서열번호: 737, 서열번호: 770, 서열번호:771, 서열번호: 775, 또는 서열번호: 781의 서열을 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 서열에 하나 이상의 추가의 변경을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 597-781 중 임의의 하나의 서열에 하나 이상의 추가의 변경을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호:732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열을 포함한다. 일부 실시형태에서, gNA 변이체 스캐폴드는 서열번호:732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열로 구성되고, 본 명세서에 기재된 임의의 실시형태의 표적화 서열을 추가로 포함한다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 600, 서열번호: 659, 서열번호: 603, 서열번호: 660, 서열번호: 661, 서열번호: 662, 서열번호: 599, 서열번호: 663, 서열번호: 601, 서열번호: 604, 서열번호: 608, 서열번호: 656, 서열번호: 666, 서열번호: 610, 서열번호: 667, 서열번호: 608, 서열번호: 669, 서열번호: 598, 서열번호: 670, 서열번호: 671, 서열번호: 605, 서열번호: 672, 서열번호: 734, 서열번호: 735, 서열번호: 736, 서열번호: 737, 서열번호:770, 서열번호:771, 서열번호: 775, 또는 서열번호: 781의 서열에 하나 이상의 추가의 변경을 포함한다.
개시내용의 gNA 변이체의 일부 실시형태에서, gNA 변이체는 적어도 하나의 변형을 포함하며, 여기서 서열번호: 5의 참조 가이드 스캐폴드와 비교하여 적어도 하나의 변형은 다음 중 하나 이상으로부터 선택된다: (a) 삼중체 고리에서 C18G 치환; (b) 줄기 버블에 G55 삽입; (c) U1 결실; (d) (i) 6 nt 고리 및 13 고리-근위 염기쌍이 Uvsx 헤어핀으로 대체되고; 그리고 (ii) 완전하게 염기쌍을 이루는 고리-말단 염기를 초래하는 A99의 결실 및 G65U의 치환인, 연장된 줄기 고리의 변형. 일부 실시형태에서, gNA 변이체는 서열번호: 732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열을 포함한다.
XDP 시스템에서 이용되는 gNA 변이체는 앞서 보다 완전하게 기재된 gNA의 3' 말단에 위치한 스페이서(또는 표적화 서열) 영역을 추가로 포함하며, 여기서 스페이서는 편집되는 표적 핵산에 상보적인 서열로 설계된다. 일부 실시형태에서, gNA 변이체는 적어도 14 내지 30개 뉴클레오티드의 표적화 서열을 포함하며, 여기서 서열은 편집되는 표적 핵산에 상보적이다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 뉴클레오티드를 갖는다. 일부 실시형태에서, gNA 변이체는 20개 뉴클레오티드를 갖는 표적화 서열을 포함한다. 일부 실시형태에서, 표적화 서열은 25개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 24개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 23개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 22개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 21개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 20개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 19개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 18개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 17개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 16개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 15개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 14개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적 핵산은 표적화 서열의 제1 뉴클레오티드로부터 PAM을 분리하는 적어도 단일 뉴클레오티드와 함께 표적화 서열의 5'에 위치한 PAM 서열을 포함한다. 일부 실시형태에서, PAM은 표적 영역의 비-표적화된 가닥, 즉 표적 핵산에 상보적인 가닥 상에 위치한다. 일부 실시형태에서, PAM 서열은 TC 모티프이다. 일부 실시형태에서, PAM 서열은 ATC이다. 다른 실시형태에서, PAM 서열은 TTC이다. 다른 실시형태에서, PAM 서열은 GTC이다. 다른 실시형태에서, PAM 서열은 CTC이다.
일부 실시형태에서, gNA 변이체의 스캐폴드는 서열번호: 4 또는 서열번호: 5를 포함하는 참조 gRNA의 서열에 대한 하나 이상의 추가 변경을 포함하는 변이체이다. 참조 gRNA의 스캐폴드가 서열번호: 4 또는 서열번호: 5로부터 유래되는 이들 실시형태에서, gNA 변이체의 하나 이상의 개선되거나 추가된 특성이 서열번호: 4 또는 서열번호: 5에서 동일한 특성과 비교하여 개선된다.
XDP 시스템의 일부 실시형태에서, gNA 변이체의 스캐폴드는 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 여기에 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열 중 임의의 하나를 포함하는 CasX 변이체 단백질을 갖는 RNP의 일부이다. 전기한 실시형태에서, gNA는 표적화 서열을 추가로 포함한다.
o. 화학적으로 변형된 gNA
일부 실시형태에서, 개시내용은 화학적으로-변형된 gNA에 관한 것이다. 일부 실시형태에서, 본 개시내용은 가이드 RNA 기능성을 갖고 뉴클레아제에 의한 절단에 대한 감소된 민감성을 갖는 화학적으로-변형된 gNA를 제공한다. 4개의 규범적 리보뉴클레오티드 A, C, G, 및 U 이외의 임의의 뉴클레오티드, 또는 데옥시뉴클레오티드를 포함하는 gNA는 화학적으로 변형된 gNA이다. 일부 경우에, 화학적으로-변형된 gNA는 천연 포스포디에스테르 뉴클레오티드간 연결 이외의 임의의 백본 또는 뉴클레오티드간 연결을 포함한다. 특정 실시형태에서, 보유된 기능성은 본 명세서에 기재된 임의의 실시형태의 CasX에 결합하는 변형된 gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 표적 핵산 서열에 결합하는 변형된 gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX 단백질을 표적화하는 것 또는 표적 핵산 서열에 결합하는 사전-복합체화된 CasX 단백질-gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX-gNA에 의해 표적 폴리뉴클레오티드를 닉킹하는 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX-gNA에 의해 표적 핵산 서열을 절단하는 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 개시내용의 실시형태의 CasX 단백질을 갖는 CasX 시스템에서 gNA의 임의의 다른 공지된 기능이다.
일부 실시형태에서, 개시내용은 뉴클레오티드 당 변형이 2'-O―C1-4알킬 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O―C1-3알킬-O―C1-3알킬 예컨대 2'-메톡시에틸("2'-MOE"), 2'-플루오로("2'-F"), 2'-아미노("2'-NH2"), 2'-아라비노실("2'-아라비노") 뉴클레오티드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오티드, 2'-잠금 핵산("LNA") 뉴클레오티드, 2'-잠금해제 핵산("ULNA") 뉴클레오티드, L 형태인 당("L-당"), 및 4'-티오리보실 뉴클레오티드로 구성된 군으로부터 선택된 gNA 안으로 합체된 화학적으로-변형된 gNA를 제공한다. 다른 실시형태에서, 가이드 RNA 안으로 합체된 뉴클레오티드간 연결 변형은 포스포로티오에이트 "P(S)"(P(S)), 포스포노카복실레이트(P(CH2)nCOOR) 예컨대 포스포노아세테이트 "PACE"( P(CH2COO-)), 티오포스포노카르복실레이트((S)P(CH2)nCOOR) 예컨대 티오포스포노아세테이트 "티오PACE"((S)P(CH2)nCOO-)), 알킬포스포네이트(P(C1-3알킬) 예컨대 메틸포스포네이트―P(CH3), 보라노포스포네이트(P(BH3)) 및 포스포로디티오에이트(P(S)2)로 구성된 군으로부터 선택된다.
특정 실시형태에서, 개시내용은 핵염기("염기") 변형이 2-티오우라실("2-티오U"), 2-티오시토신(" 2-티오C"), 4-티오우라실("4-티오U"), 6-티오구아닌("6-티오G"), 2-아미노아데닌("2-아미노A"), 2-아미노퓨린, 슈도우라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자데닌, 7-데아자-8-아자데닌, 5-메틸시토신("5-메틸C"), 5-메틸우라실("5-메틸U"), 5-하이드록시메틸시토신, 5-하이드록시메틸우라실, 5,6-디하이드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실("5-알릴U"), 5-알릴시토신("5-알릴C"), 5-아미노알릴우라실(" 5-아미노알릴U"), 5-아미노알릴-시토신("5-아미노알릴C"), 비염기성 뉴클레오티드, Z 염기, P 염기, 구조화되지 않은 핵산("UNA"), 이소구아닌("이소G"), 이소시토신("이소C"), 5-메틸-2-피리미딘, x(A,G,C,T) 및 y(A,G,C,T)로 구성된 군으로부터 선택된 gNA 안으로 합체된 화학적으로-변형된 gNA를 제공한다.
다른 실시형태에서, 개시내용은 하나 이상의 동위원소 변형이, 추적자로 사용되는 하나 이상의 15N, 13C, 14C, 중수소, 3H, 32P, 125I, 131I 원자 또는 기타 원자 또는 원소를 포함한 뉴클레오티드 포함하는, 뉴클레오티드 당, 핵염기, 포스포디에스테르 연결 및/또는 뉴클레오티드 포스페이트 상에 도입된 화학적으로-변형된 gNA를 제공한다.
일부 실시형태에서, gNA 안으로 합체된 "말단" 변형은 PEG(폴리에틸렌글리콜), 탄화수소 링커(헤테로원자(O,S,N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서: 케토-, 카르복실-, 아미도-, 티오닐-, 카르바모일-, 티오노카르바마오일-함유 탄화수소 스페이서 포함), 스페르민 링커, 예를 들어 6-플루오레세인-헥실과 같은 링커에 부착된 형광 염료(예를 들어, 플루오레세인, 로다민, 시아닌)를 포함하는 염료, 소광제(예를 들어, dabcyl, BHQ) 및 기타 표지(예를 들어, 비오틴, 디곡시제닌, 아크리딘, 스트렙타비딘, 아비딘, 펩티드 및/또는 단백질)로 구성된 군으로부터 선택된다. 일부 실시형태에서, "말단" 변형은 데옥시뉴클레오티드 및/또는 리보뉴클레오티드의 올리고뉴클레오티드, 펩티드, 단백질, 당, 올리고당, 스테로이드, 지질, 엽산, 비타민 및/또는 기타 분자를 포함하는 또 다른 분자에 대한 gNA의 접합(또는 결찰)을 포함한다. 특정 실시형태에서, 개시내용은 "말단" 변형(상기 기재됨)이, 포스포디에스테르 연결로 합체되고 gNA에서 2개 뉴클레오티드 사이 어느 곳에서든 합체될 수 있는, 링커 예컨대, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-디올 비스(포스포디에스테르) 링커를 통해 gNA 서열에 내부적으로 위치하는 화학적으로-변형된 gNA를 제공한다.
일부 실시형태에서, 개시내용은 형광 염료, 비-형광 표지, 태그(14C의 경우, 예를 들어 비오틴, 아비딘, 스트렙타비딘, 또는 15N, 13C, 중수소, 3H, 32P, 125I 등과 같은 동위원소 표지를 함유하는 부분), 올리고뉴클레오티드(압타머를 포함하는, 데옥시뉴클레오티드 및/또는 리보뉴클레오티드 포함), 아미노산, 펩티드, 단백질, 당, 올리고당, 스테로이드, 지질, 엽산, 비타민으로 구성된 군으로부터 선택된 원하는 모이어티에 후속적으로 접합될 수 있는, 아민, 티올(또는 설프히드릴), 하이드록실, 카르복실, 카르보닐, 티오닐, 티오카르보닐, 카르바모일, 티오카르바모일, 포스포릴, 알켄, 알킨, 할로겐 또는 작용기-말단화된 링커와 같은 말단의 작용기를 포함하는 말단 변형을 갖는 화학적으로-변형된 gNA를 제공한다. 접합은 N-하이드록시숙신이미드, 이소티오시아네이트, DCC(또는 DCI) 및/또는, 그 내용이 그 전체로 참고로 본 명세서에 포함된, "Bioconjugate Techniques" by Greg T. Hermanson, Publisher Elsevier Science, 3rd ed. (2013)에 기재된 바와 같은 임의의 다른 표준 방법을 통한 커플링을 포함하지만 이에 제한되지 않는 당업계에 잘-알려진 표준 화학을 이용한다.
III. XDP 시스템의 향성 인자 및 위형화
또 다른 양태에서, 개시내용은 유전자 편집을 위해 의도된 표적 세포 또는 조직에 대한 향성 및 선택성을 증가시키기 위한 XDP에서의 향성 인자의 혼입에 관한 것이다. XDP 실시형태의 향성 인자는 표적 세포 마커에 결합 친화성을 갖는 바이러스, 항체 단편, 및 수용체 또는 리간드로부터 유래된 외피 당단백질을 포함하지만 이에 제한되지 않는다. XDP 입자의 표면 상에 이러한 향성 인자의 함입은 XDP가 이러한 표적 세포 마커를 담지하는 표적 세포의 세포막에 선택적으로 결합하고 융합하는 능력을 고양시켜 치료적 지수가 증가하고 XDP 안으로 합체된 치료적 페이로드의 의도하지 않은 부작용이 감소한다.
일부 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 당단백질(GP)을 포함하며 여기서 GP는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 다른 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 항체 단편을 포함하며 여기서 항체 단편은 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 다른 실시형태에서, XDP는 입자의 표면 상에 G-단백질-연결된 수용체, 및 효소-연결된 수용체를 포함하는 하나 이상의 세포 표면 수용체를 포함하며 여기서 수용체는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 일부 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 리간드를 포함하며 여기서 리간드는 세포 표면 상의 리간드에 대한 수용체를 담지하는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 또 다른 실시형태에서, XDP는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공하기 위해 입자의 표면 상에 하나 이상의 당단백질, 항체 단편, 세포 수용체, 또는 리간드의 조합을 포함한다.
외피 바이러스의 경우, 바이러스 진입을 위한 막 융합은 막 당단백질 복합체에 의해 매개된다. 막 융합의 2가지 기본적 기계 원리는 외피 바이러스 중에서 보존되는 것으로 나타났다; 표적 막 계합 및 헤어핀-유사 구조로의 재접힘(Plemper, RK. Cell Entry of Enveloped Viruses. Curr Opin Virol. 1:92 (2011)). 외피 당단백질은 전형적으로 전자 현미경 이미지에서 정제된 비리온의 표면 상의 특징적인 단백질 "스파이크"로 관찰된다. 외피 바이러스에 의한 바이러스 진입의 기본 메커니즘은 위형화로 알려진 과정에서 XDP가 특정 세포 또는 기관을 표적화하도록 우선적으로 지시하는데 이용될 수 있다. 일부 실시형태에서, 개시내용의 XDP는 특정 기관 또는 세포에 대해 입증된 향성을 갖는 외피 바이러스로부터 유래된 당단백질의 혼입에 의해 위형화된다. 본 개시내용의 범주 내의 대표적인 당단백질은 표 4 및 실시예에 열거되어 있다. 일부 실시형태에서, 당단백질을 제공하기 위해 사용되는 바이러스는 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 푸그 합성 gP 융합, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7 , 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 알로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 수포성 구내염 바이러스의 당단백질 G(VSV-G), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스를 포함하지만 이에 제한되지 않는다. 당단백질 서열의 비-제한적 예는 표 4에 제공된다. 일부 실시형태에서, XDP는 표 4의 하나 이상의 당단백질 서열, 또는 여기에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 서열 동일성을 갖는 서열을 포함하며, 여기서 당단백질은 입자 내로 합체되고 표면 상에 노출되어, 편집되는 표적 세포에 대해 XDP에 대한 향성 및 증강된 선택성을 제공한다.
[표 4]: XDP용 당단백질
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 여기에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 서열을 갖는다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열을 갖는다.
일부 실시형태에서, 당단백질은 아래에 기술된 XDP 시스템의 플라스미드 벡터에 당단백질을 인코딩하는 핵산의 함입에 의해 XDP 시스템에 합체된다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열, 또는 여기에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 서열에 의해 인코딩된다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열에 의해 인코딩된다.
일부 실시형태에서, 실시형태의 XDP의 캡시드에 외피 바이러스로부터 유래된 당단백질을 포함하는 XDP는 당단백질을 갖지 않는 XDP와 비교하여 표적 세포에 대한 XDP의 결합에서 적어도 2-배, 적어도 3-배, 또는 적어도 4-배, 또는 적어도 5-배, 또는 적어도 10-배 증가를 나타낸다. 이 경우에 표적 핵산의 유전자 편집을 향상시키는 표적 세포에 대한 당단백질을 담지하는 XDP의 향상된 결합 및 흡수를 입증하는 대표적인 실시예가 하기 실시예에 제공되어 있다.
일부 실시형태에서, 본 개시내용은 입자의 외부에 연결된 항체 단편을 포함하는 XDP를 제공하며 여기서 항체 단편은 표적 세포, 조직 또는 기관 상의 표적 세포 마커 또는 수용체에 특이적 결합 친화성을 가져, XDP가 표적 세포에 대한 향성을 제공한다. 일 실시형태에서, 항체 단편은 Fv, Fab, Fab', Fab'-SH, F(ab')2, 디아바디, 단일 사슬 디아바디, 선형 항체, 단일 도메인 항체, 단일 도메인 낙타과 항체, 및 단일-사슬 가변 단편(scFv) 항체로 구성된 군으로부터 선택된다. 예시적인 표적 세포는 T 세포, B 세포, 대식세포, 액체 암 세포(예컨대 백혈병 또는 골수종 세포), 고형 종양 세포, 근육 세포, 상피 세포, 내피 세포, 줄기 세포, 수지상 세포, 망막 세포, 간 세포, 심장 세포, 갑상선 세포, 뉴런, 신경교 세포, 희돌기아교세포, 슈반 세포 및 췌장 세포를 포함한다. 예시적인 표적 기관은 뇌, 심장, 간, 췌장, 폐, 눈, 위, 소장, 결장 및 신장을 포함한다. 예시적인 조직은 피부, 근육, 뼈, 상피 및 결합 조직을 포함한다. 표적 세포 마커 또는 리간드는 핵산 편집이 필요한 표적 세포에서 우선적으로 발현되는 것으로 알려진 세포 수용체 또는 표면 단백질을 포함할 수 있다. 이러한 경우에, 실시형태의 XDP의 캡시드에 항체 단편을 포함하는 XDP는 항체 단편을 갖지 않는 XDP에 비교하여 표적 세포 마커 또는 수용체를 담지하는 표적 세포에 대한 결합에서 적어도 2-배, 적어도 3-배, 또는 적어도 4-배, 또는 적어도 5-배 또는 적어도 10-배 증가를 나타낸다. 암 세포 마커 또는 수용체에 친화성을 갖는 항체 단편의 경우, 암 세포 마커 또는 수용체는 분화 클러스터 19(CD19), 분화 클러스터 3(CD3), CD3d 분자(CD3D), CD3g 분자(CD3G), CD3e 분자(CD3E), CD247 분자(CD247 또는 CD3Z), CD8a 분자(CD8), CD7 분자(CD7), 막 메탈로엔도펩티다제(CD10), 막 스패닝 4-도메인 A1(CD20), CD22 분자(CD22), TNF 수용체 슈퍼패밀리 구성원 8(CD30), C-유형 렉틴 도메인 패밀리 12 구성원 A(CLL1), CD33 분자(CD33), CD34 분자(CD34), CD38 분자(CD38), 인테그린 서브유닛 알파 2b (CD41), CD44 분자(인도 혈액 군)(CD44), CD47 분자(CD47), 인테그린 알파 6(CD49f), 신경 세포 부착 분자 1(CD56), CD70 분자(CD70), CD74 분자(CD74), CD99 분자(Xg 혈액 군)(CD99), 인터루킨 3 수용체 서브유닛 알파(CD123), 프로미닌 1(CD133), 신데칸 1(CD138), 카보닉스 탈수효소 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 부착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리성 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEA 세포 부착 분자 5(CEACAM5), 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 패밀리 12 구성원 A(CLEC12A), 중간엽-상피 전이 인자(cMET), 세포독성 T-림프구-연관된 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), 표피 성장 인자 수용체 변형체 III(EGFRvIII), 상피 당단백질 2(EGP-2), 상피 세포 부착 분자( EGP-40 또는 EpCAM), EPH 수용체 A2(EphA2), 엑토뉴클레오티드 피로포스파타제/포스포디에스테라제 3(ENPP3), erb-b2 수용체 티로신 키나제 2(ERBB2), erb-b2 수용체 티로신 키나제 3(ERBB3), erb-b2 수용체 티로신 키나제 4(ERBB4), 엽산 결합 단백질(FBP), 태아 니코틴성 아세틸콜린 수용체(AChR), 엽산 수용체 알파(Fralpha 또는 FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사성 수용체 8(GRM8), 글리피칸-3(GPC3), 강글리오시드 GD2, 강글리오시드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), 인간 표피 성장 인자 수용체 3(HER3),, 인테그린 B7, 세포간 세포-부착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY), 콘드로모듈린-1(LECT1), L1 세포 부착 분자(L1CAM), 리소포스파티드산 수용체 3(LPAR3), 흑색종-연관된 항원 1(MAGE-A1), 메조텔린(MSLN), 뮤신 1(MUC1), 뮤신 16, 세포 표면 연관(MUC16), 흑색종-연관된 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식된 흑색종 항원 1(MART1), 당단백질 100(GPl00), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해군 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 영양막 당단백질(TPBG), 종양-연관된 당단백질 72(TAG-72), 종양-연관된 칼슘 신호 변환기 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF-R2), 윌름스 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현된 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2 및 (T-세포 면역글로불린 뮤신-3) TIM-3을 포함할 수 있지만 이에 제한되지 않는다. 뉴런 수용체에 친화성을 갖는 항체 단편의 경우, 세포 마커 또는 수용체는 아드레날린성(예를 들어, α1A, α1b, α1c, α1d, α2a, α2b, α2c, α2d, β1, β2, β3), 도파민성(예를 들어, D1, D2, D3, D4, D5), GABA성(예를 들어, GABAA, GABAB1a, GABAB1δ, GABAB2, GABAC), 글루타민성(예를 들어, NMDA, AMPA, 카이네이트, mGluR1, mGluR2, mGluR3, mGluR4, mGluR5, mGluR6, mGluR7), 히스타민성(예를 들어, H1, H2, H3), 콜린성(예를 들어, 무스카린성(예를 들어, M1, M2, M3, M4, M5; 니코틴성(예를 들어, 근육, 뉴런(α-붕가로톡신-비민감성), 뉴런(α-붕가로톡신-민감성)), 오피오이드(예를 들어, μ, δ1, δ2, κ) 및 세로토닌성(예를 들어, 5-HT1A, 5-HT1B, 5-HT1D, 5-HT1E, 5-HT1F, 5-HT2A, 5-HT2B, 5-HT2C, 5-HT3, 5-HT4, 5-HT5, 5-HT6, 5-HT7)을 포함할 수 있지만 이에 제한되지 않는다.
일 실시형태에서, 항체 단편은 그의 생산 및 생산하는 숙주 세포로부터의 단리 후에 XDP에 접합된다. 또 다른 실시형태에서, 항체 단편은 XDP 시스템의 생산하는 숙주 세포에 의해 발현되는 XDP 캡시드의 일부로서 생산된다. 일부 경우에, 본 개시내용은 XDP 캡시드 또는 다른 XDP 성분을 인코딩하는 핵산에 작동가능하게 연결된 항체 단편을 인코딩하는 서열을 포함하는 핵산을 제공한다.
IV. XDP 시스템을 인코딩하는 핵산
또 다른 양태에서, 본 개시내용은 XDP 시스템의 성분을 인코딩하는 핵산과 혼입된 치료 페이로드, 및 핵산을 포함하는 벡터, 뿐만 아니라 핵산 및 벡터를 제조하는 방법에 관한 것이다.
일부 실시형태에서, 본 개시내용은 레트로바이러스-유래된 XDP 구조를 포함하는 성분 및 프로세싱 성분, 치료 페이로드 및 향성 인자를 인코딩하는 하나 이상의 핵산을 제공한다. 실시형태의 주요 구조적 성분 및 XDP 입자의 가공 및 어셈블리에 이용되는 핵산 및 벡터는 다양한 바이러스, 예컨대 레트로바이러스과 패밀리 구성원 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 스푸마레트로바이러스아과를 포함하지만 이에 제한되지 않는 레트로바이러스, 또는 렌티바이러스 예컨대 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV), 소 면역결핍 바이러스(BIV), 젬브라나병 바이러스(JDV), 말 감염성 빈혈 바이러스(EIAV), 염소 관절염 뇌염 바이러스(CAEV) 등으로부터 유래될 수 있다.
일부 실시형태에서, XDP 레트로바이러스 성분을 인코딩하는 핵산은 조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV)를 포함하지만 이에 제한되지 않는 알파레트로바이러스로부터 유래된다. 일부 실시형태에서, 본 개시내용은 매트릭스 폴리펩티드(MA); p2A 스페이서 펩티드; ap2B 스페이서 펩티드; p10 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2A, p2B, p10, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 인코딩하는 핵산을 제공한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p2A, p2B, p10, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 비제한적으로 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함하는 알파레트로바이러스로부터 유래된다. 일부 실시형태에서, 알파레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 마우스 유방 종양 바이러스(MMTV), 메이슨-화이자 원숭이 바이러스(MPMV) 및 동물성 비강 종양 바이러스(ENTV)를 포함하나 이에 제한되지는 않는 베타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp21/24 스페이서 펩티드; p3-P8/p12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), pp21/24, p3-8/p12, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 상기 실시형태에서, Gag 성분(예를 들어, MA, CA, pp21/24 스페이서, p3-p8/p12 스페이서 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 마우스 유방 종양 바이러스, 메이슨-화이자 원숭이 바이러스 및 동물성 비강 종양 바이러스를 포함하지만 이에 제한되지 않는 베타레트로바이러스로부터 유래된다. 일부 실시형태에서, 베타레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열 235-257, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 소 백혈병 바이러스(BLV) 및 인간 T-림프영양성 바이러스(HTLV1)를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA),, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 일부 실시형태에서, 델타레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열 서열번호: 258-272, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 Walleye 피부 육종 바이러스(WDSV), 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p20 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p20, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 일부 실시형태에서, 엡실론레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 273-277의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 뮤어라인 백혈병 바이러스(MLV), 말로니 뮤어라인 백혈병 바이러스(MMLV) 및 고양이 백혈병 바이러스(FLV)를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용을 인코딩하는 핵산은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), pp12 스페이서, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, pp12, CA 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 일부 실시형태에서, 감마레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 278-287의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 HIV-1 및 HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드(CA), p2 스페이서 펩티드, 뉴클레오캡시드(NC), p1/p6 스페이서 펩티드; ); 매트릭스 폴리펩티드(MA), CA, P2, NC, 및 p1/p6을 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, NC, 및 p1/p6), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 HIV-1, HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 일부 실시형태에서, 렌티바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 288-312 및 334-339의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 이러한 경우에, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 P68 Gag; p3 Gag; P68 Gag 및 p3 gag를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 일부 실시형태에서, 수마레트로바이러스아과-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 313-333의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
다른 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP의 레트로바이러스 성분은 레트로바이러스과의 상이한 속으로부터 선택된다. 따라서 XDP를 인코딩하는 핵산은 매트릭스 폴리펩티드(MA), p2A 스페이서 펩티드, p2B 스페이서 펩티드; p10 스페이서 펩티드, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), pp21/24 스페이서 펩티드, p3-p8 스페이서 펩티드, pp12 스페이서 펩티드, p20 스페이서 펩티드, p1/p6 스페이서 펩티드, p68 Gag, p3 Gag, 절단 부위(들), 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로부터 선택된 2개 이상의 성분을 포함할 수 있으며 여기서 성분은 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 렌티바이러스, 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스 중 2개 이상으로부터 유래된다.
HIV-1로부터 유래된 레트로바이러스 성분에서, 부가 단백질 인테그라제(또는 그의 인코딩 핵산)는 XDP 시스템 뿐만 아니라, 시험관내 바이러스 복제에 필수적인, HIV 기능적 보조 유전자 vpr, vpx(HIV-2)로부터 생략될 수 있다. 부가적으로, XDP 시스템의 핵산은 실시형태의 XDP 조성물의 생성을 위한 역전사효소를 필요로 하지 않는다. 따라서, 일 실시형태에서, XDP의 HIV-1 Gag-Pol 성분은, 이후 아래에 보다 완전하게 기술된 Gag-TFR-PR로 지칭되는, 프로테아제 절단 부위에 의해 분리된, 트랜스프레임 옥타펩티드(TFP) 및 p6pol의 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 연결된 Gag로 끝이 절단될 수 있다.
[표 5]: DNA 서열을 인코딩하는 레트로바이러스 구조적 구성요소
Figure pct00065
Figure pct00066
Figure pct00067
* 야생형 서열(구성에 따라 선택적으로 합체됨)
일부 실시형태에서, 본 개시내용은 XDP의 표면에 합체되고 그 위에 표시되는 향성 인자에 대한 서열을 인코딩하는 핵산을 제공하며, 여기서 향성 인자는 표적 세포 또는 조직의 막과 결합하고 융합하는 XDP의 증가된 능력을 부여한다. 일 실시형태에서, 향성 인자는 당단백질이며, 여기서 인코딩 핵산은 표 4의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 또 다른 실시형태에서, 개시내용은 항체 단편을 인코딩하는 핵산을 제공하며, 여기서 항체 단편은 표적 세포 또는 조직 상의 표적 세포 마커 또는 수용체에 대해 특이적 결합 친화성을 갖는다. 또 다른 실시형태에서, 개시내용은 세포 수용체를 인코딩하는 핵산을 제공하며, 여기서 세포 수용체는 표적 세포 또는 조직 상의 표적 세포 마커에 대해 특이적 결합 친화성을 갖는다. 또 다른 실시형태에서, 개시내용은 리간드를 인코딩하는 핵산을 제공하며, 여기서 리간드는 표적 세포 또는 조직 상의 표적 세포 마커 또는 수용체에 대해 특이적 결합 친화성을 갖는다. 향성 인자를 인코딩하는 핵산의 함입에 의해, 생성된 XDP가 표적 세포 또는 조직에 대한 선택성을 증가시켜, 증가된 치료 지수와 감소된 표적-외 효과를 초래할 것이다는 것을 이해할 것이다.
본 개시내용은 XDP 안으로 합체된 치료 페이로드를 인코딩하거나 포함하는 핵산을 추가로 제공한다. 예시적인 치료 페이로드는 상기에서 본 명세서에 기술되었다. 일부 실시형태에서, XDP의 치료 페이로드는 CRISPR 뉴클레아제 및 하나 이상의 가이드 RNA이다. 전기한 것의 특정 실시형태에서, 개시내용은 표 1의 CasX 뉴클레아제를 인코딩하는 핵산, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 제공한다. 이러한 핵산의 대표적인 예는 서열번호: 354, 340-342, 346-349, 378-387 및 426-431의 핵산을 개시하는 실시예의 표 6-8, 11 및 16에 제시되어 있다. 전기한 것의 또 다른 특정 실시형태에서, 개시내용은 표 3에 제시된 서열번호: 597-781의 gNA 변이체를 인코딩하는 핵산, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 제공하고, 여기서 gNA는 표적 핵산에 상보적인 표적화 서열을 추가로 포함한다.
개시내용의 일부 실시형태에서, XDP 시스템의 성분은 1개, 2개, 3개, 4개, 5개 또는 그 초과의 핵산에 의해 인코딩되며(대표적인 플라스미드 및 XDP 구성의 개략도인 도 36-68 참고), 이는 진핵 세포에서 작동가능하고 발현되는 구성요소에 적합한 조절 요소에 (그의 제어 하에서) 작동가능하게 연결되어 있는 단일 구성요소 또는 다중 구성요소를 인코딩할 수 있다. XDP 시스템 구성의 설명에서 조절 요소, 절단 서열 등의 배치를 이용하기 위해 핵산 내에 인코딩된 구성요소의 절대 순서가 변경될 수 있어, 각 구성요소가 당업계의 통상인에 의해 이해되는 바와 같이 최적의 양식으로 XDP의 어셈블리에서 발현 및/또는 활용될 수 있다는 것을 이해할 것이다. 예를 들어, 핵산이 Gag 폴리단백질, 치료 페이로드 및 프로테아제 절단 부위를 인코딩하는 경우, 순서(5'에서 3')는 Gag-절단 부위-치료 페이로드일 수 있거나 또는 치료 페이로드-절단 부위-gag일 수 있고, 단일 핵산에 인코딩된 구성요소의 임의의 조합에 대해서도 동일하게 적용되는 것이 의도된다. 대표적인 조절 요소가 본 명세서에 기술되어 있다.
일부 실시형태에서, 개시내용은 레트로바이러스 Gag 폴리단백질(이의 전부 또는 일부), 프로테아제 절단 부위, 치료 페이로드, Gag-Pol 폴리단백질 및 향성 인자 중 둘 이상으로부터 선택된 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질(또는 이의 일부), 향성 인자 및 gNA를 인코딩한다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개 구성요소를 분리하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질을 인코딩하고, 제3 핵산은 향성 인자 및 gNA를 인코딩한다. 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 Gag-Pol 폴리단백질(또는 이의 일부)을 인코딩하고, 그리고 제4 핵산은 gNA를 인코딩한다. 일부 경우에, 프로테아제 절단 부위는 생략된다. 다른 경우에, 프로테아제 절단 부위는 Gag 폴리단백질의 각 구성요소와, 선택적으로, 치료 페이로드 사이에 위치한다. 전기한 실시형태의 인코딩 핵산의 대표적인 예가 실시예에 제시되어 있다.
다른 실시형태에서, 개시내용은 Gag-TFR-PR 폴리단백질(또는 이의 일부), 프로테아제 절단 부위, 치료 페이로드로서의 CasX 단백질, gNA, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag-TFR-PR 폴리단백질 및 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 또 다른 실시형태에서, 제1 핵산은 Gag-TFR-PR 폴리단백질 및 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위는 Gag 폴리단백질의 각 구성요소와, 선택적으로 CasX 단백질 사이에 위치한다. 전기한 실시형태의 인코딩 핵산의 대표적인 예가 실시예에 제시되어 있다(표 16, 17, 19, 20, 22, 23, 24, 27, 30, 33 및 36 및 그 안에 포함된 서열 참고).
다른 실시형태에서, 개시내용은 Gag 폴리단백질(또는 이의 일부), 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 향성 인자를 포함하는 XDP 시스템의 성분을 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질, 프로테아제, CasX 단백질, 및 구성요소 사이에 위치한 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩한다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질, 프로테아제, CasX 단백질 및 구성요소 사이의 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고; 그리고 제3 핵산은 하나 이상의 gNA를 인코딩한다.
다른 실시형태에서, 개시내용은 Gag-Pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자, gNA 및 RNA 결합 도메인을 인코딩한다. 전기한 것의 또 다른 경우에서, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩한다.
일부 실시형태에서, 개시내용은 Gag-Pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 향성 인자, 및 gNA를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하는 제1 핵산을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩한다.
다른 실시형태에서, 개시내용은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 다른 경우에, 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하는 제1 핵산을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 MA, CasX 단백질 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고; 제3 핵산은 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 MA 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩하고, 제4 핵산은 프로테아제를 인코딩한다. 전기한 실시형태에서, 제1 핵산은 추가의 개재하는 프로테아제 절단 부위에 의해 MA에 연결된 CA 구성요소를 추가로 코딩할 수 있다. 전기한 것의 일부 실시형태에서, 프로테아제 및 프로테아제 절단 부위는 생략된다.
일부 실시형태에서, 개시내용은 Gag 폴리단백질(이의 전부 또는 일부), CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 향성 인자, 및 Gag-Pol 폴리단백질(이의 전부 또는 일부)를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 제1 핵산은 Gag 폴리단백질, CasX 단백질, 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질, 향성 인자, 및 gNA를 인코딩한다. 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질 및 2개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 프로테아제를 인코딩하고, 제3 핵산은 향성 인자, gNA 및 Gag-Pol 폴리단백질을 인코딩한다. 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질 및 2개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 프로테아제를 인코딩하고, 제3 핵산은 향성 인자를 인코딩하고, 제4 핵산은 gNA 및 Gag-Pol 폴리단백질을 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 및 프로테아제 절단 부위는 생략된다.
다른 실시형태에서, XDP 시스템은 표 16, 17, 19, 20, 22, 23, 24, 27, 30, 33, 또는 36에 제시된 서열번호: 426-436, 784-823, 828-873, 880-933, 947-1009의 핵산 서열, 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 서열 동일성을 갖는 서열로 구성된 군으로부터 선택된 서열의 일부 또는 전부에 의해 인코딩된다.
일부 실시형태에서, 본 명세서에 기재된 임의의 실시형태의 XDP 시스템을 인코딩하는 핵산은 공여자 주형 핵산을 추가로 포함하며 여기서 공여자 주형은 돌연변이를 교정하거나 유전자를 녹-다운 또는 녹-아웃하기 위해 표적 핵산 안으로 삽입되는 서열을 포함한다. 일부 실시형태에서, 공여자 주형 서열은 표적 핵산의 절단 부위에 대해 상동성 5' 및 3'의 2개 영역(즉, 상동성 암)에 의해 측접된 비-상동성 서열을 포함하여, HDR 또는 HITI에 의해 매개될 수 있는 표적 영역에서 비-상동성 서열의 삽입을 용이하게 한다. HITI에 의해 삽입된 외인성 공여자 주형은 임의의 길이, 예를 들어 1 내지 50개 뉴클레오티드 길이의 비교적 짧은 서열, 또는 약 50-1000개 뉴클레오티드 길이의 보다 긴 서열일 수 있다. 상동성의 결여는 예를 들어 20-50% 이하의 서열 동일성을 갖고/갖거나 낮은 엄격도에서 특이적 혼성화가 결여될 수 있다. 다른 경우에, 상동성의 결여는 5, 6, 7, 8, 또는 9bp 이하의 동일성을 갖는 기준을 추가로 포함할 수 있다. 그러한 경우에, 상동성 암의 사용은 뉴클레아제에 의해 도입된 절단 부위(들)에서 비-상동성 서열의 삽입을 용이하게 한다. 일부 실시형태에서, 공여자 주형 폴리뉴클레오티드는 적어도 약 10, 적어도 약 50, 적어도 약 100, 또는 적어도 약 200, 또는 적어도 약 300, 또는 적어도 약 400, 또는 적어도 약 500, 또는 적어도 약 600, 또는 적어도 약 700, 또는 적어도 약 800, 또는 적어도 약 900, 또는 적어도 약 1000, 또는 적어도 약 10,000, 또는 적어도 약 15,000 뉴클레오티드를 포함한다. 다른 실시형태에서, 공여자 주형은 적어도 약 10 내지 약 15,000 뉴클레오티드, 또는 적어도 약 100 내지 약 10,000 뉴클레오티드, 또는 적어도 약 400 내지 약 8,000 뉴클레오티드, 또는 적어도 약 600 내지 약 5000 뉴클레오티드, 또는 적어도 약 1000 내지 약 2000 뉴클레오티드를 포함한다. 공여자 주형 서열은 게놈 서열과 비교하여 특정 서열 차이; 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택가능한 마커(예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에서 공여자 핵산의 성공적인 삽입을 평가하는 데 사용될 수 있거나 또는 일부 경우에 다른 목적으로 사용될 수 있다(예를 들어, 표적화된 게놈 유전자좌에서 발현을 나타내기 위함). 대안적으로, 이들 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 FLP, loxP 서열 등과 같은 측접하는 재조합 서열을 포함할 수 있다. 또 다른 실시형태에서, 공여자 주형은 표적 유전자의 적어도 일부를 인코딩하는 핵산을 포함하며 여기서 공여자 주형 핵산은 돌연변이를 포함하는 표적 유전자와 비교하여 야생형 서열의 전부 또는 일부를 포함하고, 여기서 공여자 주형은 유전자 편집 과정 동안 HDR에 의해 세포의 표적 핵산 내에 삽입된다. 이러한 경우에 표적 핵산 내에 삽입시 기능적 유전자 산물이 발현될 수 있도록 표적 유전자를 교정한다. 일부 실시형태에서, 공여자 주형은 10-10,000개 뉴클레오티드의 크기 범위이다. 다른 실시형태에서, 공여자 주형은 100-1,000개 뉴클레오티드의 크기 범위이다. 일부 실시형태에서, 공여자 주형은 단일-가닥 DNA 주형 또는 단일 가닥 RNA 주형이다. 다른 실시형태에서, 공여자 주형은 이중-가닥 DNA 주형이다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 XDP 시스템의 제1 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제2 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제3 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제4 또는 제5 핵산에 혼입된다.
일부 실시형태에서, 각각의 개별 핵산은 진핵 패키징 세포 내로의 형질감염에 적합한 플라스미드 벡터 내로 혼입되고, 그 예는 하기에 보다 완전하게 기재되어 있어 XDP 시스템이 도 36-68에 묘사된 바와 같이 1, 2, 3, 4 또는 5개 플라스미드를 포함할 것이다. 각각의 경우에, XDP 시스템의 구성요소를 인코딩하는 뉴클레오티드 서열은 진핵 세포에서 조작가능하고 발현되는 구성요소에 적합한 조절 요소에 (그의 제어 하에서) 작동가능하게 연결된다. 예시적인 조절 요소는 전사 프로모터(예를 들어, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, MMLV-ltr 및 메탈로티오네인), 전사 인핸서 요소, 전사 종결 신호, 단일 전사체로부터 다중 유전자의 번역을 허용하는 내부 리보솜 진입 부위(IRES) 또는 p2A 펩티드, 다운스트림 전사 종결을 촉진하는 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 일부 경우에 프로모터는 CMV 프로모터, CAGG, PGK, U6(shRNA를 합성하는 RNA pol III의 경우), 신장 인자 1 알파(EF1-알파) 또는 H1과 같은 구성적 프로모터이다. 일 실시형태에서, 인간 사이토메갈로바이러스 즉시 초기(HCMV-IE) 인핸서/프로모터와 같은 구성적 프로모터는 tat에 의해 정상적으로 제공되는 전사의 조절을 보상하기 위해 사용된다. 다른 경우에, 프로모터는 유도성 프로모터 예컨대, 이에 제한되지는 않지만, T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노사이드(IPTG)-조절된 프로모터, 열 충격 프로모터, 또는 테트라사이클린-조절된 프로모터(TRE), 또는 음성 유도성 pLac 프로모터일 수 있다. 당업자에게 공지된 임의의 강력한 프로모터가 핵산의 발현을 유도하기 위해 사용될 수 있다. 렌티바이러스 패키징 구성요소를 인코딩하는 핵산의 경우, 벡터는 psPax2(실시예에서 자세히 설명됨, 서열번호: 430) 또는 pMDLg/pRRE 플라스미드일 수 있다. VSV-G 위형화 바이러스 외피 당단백질을 인코딩하는 핵산의 경우, 벡터는 pMD2.G 플라스미드일 수 있다.
실시형태의 벡터는 또한 예를 들어 CasX 서열과 같은 치료 페이로드의 다운스트림일 수 있는 폴리아데닐화 신호를 포함할 수 있다. 폴리아데닐화 신호는 SV40 폴리아데닐화 신호, LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간
Figure pct00068
-글로빈 폴리아데닐화 신호일 수 있다. SV40 폴리아데닐화 신호는 pCEP4 벡터(Invitrogen, 캘리포니아주 샌디에고 소재)로부터의 폴리아데닐화 신호일 수 있다.
실시형태의 벡터는 또한 CasX 서열 또는 gNA 서열과 같은 치료 페이로드의 업스트림에 인핸서를 포함할 수 있다. 인핸서는 DNA 발현에 필요할 수 있다. 인핸서는 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴 또는 CMV, HA, RSV 또는 EBV로부터의 것과 같은 바이러스 인핸서일 수 있다. 폴리뉴클레오티드 기능 인핸서는 미국 특허 번호 5,593,972, 5,962,428 및 WO94/016737에 기술되어 있으며, 각각의 내용은 참고로 완전히 포함된다. 벡터는 또한 벡터를 염색체외로 유지하고 세포에서 벡터의 다중 카피를 생성하기 위해 포유동물 복제 기점을 포함할 수 있다. 벡터는 또한 벡터가 투여되는 포유동물 또는 인간 세포에서 유전자 발현에 매우 적합할 수 있는 조절 요소를 포함할 수 있다. 벡터는 또한 녹색 형광 단백질("GFP")과 같은 리포터 유전자 및/또는 하이그로마이신("Hygro")과 같은 선택가능한 마커를 포함할 수 있다.
HIV-기반 벡터의 사용을 포함하는 실시형태에서, 벡터는 바이러스 단백질의 복제를 보조하는 인자 또는 부속 단백질을 인코딩하는 추가 서열을 포함할 수 있다. 일 실시형태에서, HIV-기반 벡터는 RNA 폴리머라제 II의 활성화에 관여하고 전사 및 번역을 자극하는 단백질인 tat를 인코딩하는 서열을 포함한다(Das, A., 등 The HIV-1 Tat Protein Has a Versatile Role in Activating Viral Transcription. J Virol. 85(18): 9506 (2011)). 또 다른 실시형태에서, HIV-기반 벡터는 인트론-함유 HIV-1 RNA의 핵 유출에 중요한 RNA 결합 단백질인 Rev를 인코딩하는 서열을 포함한다(Pollard, V., 등 The HIV-1 Rev protein. Ann Rev Microbiol. 52:491 (1998)). 또 다른 실시형태에서, HIV-기반 벡터는 유비퀴틴화 및 세포 분해를 위해 표적화함에 의해 포유동물 효소 APOBEC의 항바이러스 활성을 파괴하는 바이러스 복제에 필수적인 부속 단백질인 바이러스 감염성 인자(Vif)를 인코딩하는 서열을 포함한다(Yang, G., 등 Viral infectivity factor: a novel therapeutic strategy to block HIV-1 replication. Minireviw Med Chem 13(7):1047 (2013)). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 세포 제한 인자의 항바이러스 활성을 억제할 뿐만 아니라 감염된 세포로부터 바이러스 입자의 효율적인 방출에 필수적인 부속 단백질인 바이러스 단백질 U(Vpu)를 인코딩하는 서열을 포함한다(Gonz
Figure pct00069
lez, M. Vpu Protein: The Viroporin Encoded by HIV-1. Viruses 7:4352 (2015). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 적응성 세포-매개된 면역을 회피하는 것뿐만 아니라 표적 세포에서 감염성을 고양하는데 필수적인 부속 단백질인 음성 인자(Nef)를 인코딩하는 서열을 포함한다(Basmaciogullari, S., 등 The activity of Nef on HIV-1 infectivity. Frontiers Microbiol 5:232 (2014). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 항-바이러스 경로를 제한하는 잠재적 역할에 부가하여 바이러스 복제에 영향을 미치는 다수의 세포 단백질과의 그 상호작용에 중요한 부속 단백질인 바이러스 단백질 R(VpR)을 인코딩하는 서열을 포함한다(Zhao, Richard Y, and Michael I Bukrinsky. HIV-1 accessory proteins: VpR. Methods Mol Biol 1087:125 (2014). 일부 실시형태에서, HIV-기반 벡터는 tat, Vif, Rev, Vpu, Nef 및 VpR의 임의의 조합을 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1/p6 폴리펩티드 및 CasX 폴리펩티드를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 프로테아제(PRO), 역전사효소(RT) 및 인테그라제(INT)에 작동가능하게 연결된, 5'에서 3'으로 MA, CA, p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1/p6 폴리펩티드 및 CasX 폴리펩티드를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 CasX 폴리펩티드 및 PRO에 작동가능하게 연결된, 5'에서 3'으로 MA, CA, NC, p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 5'에서 3'으로 MA, CA, NC 및 p1/p6을 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, NC, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, tev 절단 서열(TCS), 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS 및 TEV 프로테아제(TEV)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PreScission 절단 서열(PCS) 및 PreScission 프로테아제(PSP)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 PreScission 프로테아제(PSP)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 PSP를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 TEV를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, P1 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, NC, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX, NC, 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, NC, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, 알파레트로바이러스 gag 폴리단백질 성분 P2A, P2B 및 P10, 뿐만 아니라 CA, NC, PRO 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, pp21/24, P12/P3/P8, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA, NC, PRO, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA, NC, PRO, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, P6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, p68-Gag를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA, NC, PRO 및 CasX를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, pp21/24, P12/P3/P8, CA, NC를 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, p20, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, pp12, CA, NC, PRO 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, P6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5' 내지 3', p68-Gag, p3-Gag 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 p68-Gag, p3-Gag 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, p68-Gag, p3-Gag를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, CasX 및 p1/p6을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, P2, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
전기한 것 중 임의의 것에서, 임의의 성분이 프로테아제 절단 부위, 자가-절단 폴리펩티드, 또는 내부 리보솜 진입 부위, 또는 이의 임의의 조합을 인코딩하는 서열에 의해 분리될 수 있다.
V. XDP 패키징 세포
또 다른 양태에서, 본 개시내용은 XDP의 생산에 이용되는 패키징 세포에 관한 것이다. 본 명세서에 사용된 바와 같이, 용어 "패키징 세포"는 패키징 신호를 함유하지 않지만 XDP 입자의 올바른 패키징에 필요한 또는 유용한 바이러스 구조 단백질 및 복제 효소(예를 들어, Gag, pol 등)를 안정적으로 또는 일시적으로 발현하는 세포주와 관련하여 사용된다. 실시형태에서, 세포주는 (개별 유기체로부터의) 1차 생체외 배양된 세포 뿐만 아니라 확립된 세포주를 포함하는, XDP의 생산에 적합한 임의의 세포주일 수 있다. 세포 유형은 박테리아 세포, 효모 세포 및 포유동물 세포를 포함할 수 있다. 예시적인 박테리아 세포 유형은 대장균을 포함할 수 있다. 예시적인 효모 세포 유형은 사카로마이세스 세레비지애를 포함할 수 있다. 스포돕테라 프루기페르다 sf9 세포와 같은 곤충 세포주도 패키징 세포로 사용하기에 적합하다. 예시적인 포유동물 세포 유형은 마우스, 햄스터 및 인간 1차 세포, 뿐만 아니라 세포주 예컨대 인간 배아 신장 293(HEK293) 세포, Lenti-X 293T 세포, 베이비 햄스터 신장(BHK) 세포, HepG2 세포, Saos-2 세포, HuH7 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO 세포, NIH3T3 세포, COS 세포, WI38 세포, MRC5 세포, A549 세포, HeLa 세포, 차이니즈 햄스터 난소(CHO) 세포, 또는 HT1080 세포를 포함할 수 있다. 세포 유형에 대한 적절한 벡터의 선택은 당업자에게 용이하게 명백할 것이다. 일부 실시형태에서, 진핵 세포는 XDP 내로 합체될 수 있는 세포 표면 마커의 발현을 감소시키기 위해 하나 이상의 돌연변이 하나 이상의 돌연변이에 의해 변형된다. 그러한 마커는 MHC 수용체에 의해 결합될 수 있거나 그렇지 않으면 대상체에서 면역 반응을 촉발할 수 있는 수용체 또는 단백질을 포함할 수 있다.
XDP 시스템의 실시형태에서, 벡터는 특정 치료 페이로드(예를 들어, 표적 핵산을 편집하기 위해 설계된 CasX:gNA) 뿐만 아니라, 상기에서 상세히 설명된 다른 바이러스-유래된 구조 성분(예를 들어, Gag 폴리단백질, pol 폴리단백질, 향성 인자, 및 선택적으로 공여자 주형 핵산 서열)을 인코딩하는 패키징 세포 내로 도입된다. 벡터는 염색체-외 요소로 남을 수 있거나 일부 또는 전부가 숙주 세포 염색체 DNA 내에 합체되어 안정적으로-형질전환된 패키징 세포를 생성할 수 있다.
일부 실시형태에서, XDP 시스템의 핵산을 포함하는 벡터는 형질감염, 형질도입, 리포펙션 또는 전기천공을 통해 세포 내로 도입되어 패키징 세포주를 생성한다. 벡터의 도입은 Qiagen으로부터 상업적으로 이용가능한 TransMessenger 시약, Stemgent로부터 Stemfect RNA Transfection Kit, 및 Mirus Bio LLC로부터 TransIT-mRNA Transfection Kit, Lonza 뉴클레오펙션, Maxagen 전기천공 등의 하나 이상을 사용할 수 있다. 형질감염, 형질도입 또는 감염을 위한 방법은 당업자에게 잘 알려져 있다.
일부 경우에, 패키징 벡터는 neo, DHFR, Gln 합성효소 또는 ADA와 같은 우성 선별 마커와 함께 세포 내로 도입된 다음 적절한 약물 존재 하에 선별 및 클론의 분리가 뒤따른다. 선별 마커 유전자는 패키징 벡터에 의해 인코딩되는 유전자에 물리적으로 연결될 수 있다.
형질감염된 숙주 세포로부터의 캡슐화된 치료 페이로드를 갖는 XDP의 어셈블리 및 방출은 바이러스 구조 단백질인 Gag에 의해 매개될 수 있다. 인간 면역결핍 바이러스 유형 1(HIV-1) Gag는 전구체 폴리단백질인 Pr55gag로 합성된다. 이 폴리단백질은 4개의 주요 구조 도메인으로 구성되며, 이는 바이러스 프로테아제에 의해 출아 과정 동안 또는 직후에 p17 매트릭스(MA), p24 캡시드(CA), p7 뉴클레오캡시드(NC) 및 p6으로 절단된다(Adamson CS., and Freed EO. Human immunodeficiency virus type 1 assembly, release, and maturation. Adv. Pharmacol. 55:347 (2007)). HIV-1 시스템을 활용하면 세포로부터 XDP의 효율적인 생산을 할 수 있도록 하는 것은 p55 Gag 단백질을 발현하는 것으로 충분하다(Gheysen 등, Assembly and release of HIV-1 precursor Pr55Gag virus-like particles from recombinant baculovirus-infected insect cells. Cell. 59(1):103 (1989)). 절단되지 않은 Pr55Gag의 맥락에서, MA는 Gag 단백질의 N-말단 도메인을 구성하고 원형질막에 대한 Gag 전구체의 막 결합 및 국소화에 필수적이다. CA 및 NC 도메인은 각각 직접적인 단백질-단백질 상호작용 및 간접적인 RNA-매개된 상호작용을 통해 Gag 다량체화를 촉진한다. p6 내에 후기 도메인 모티프의 함입은 세포 표면에서 XDP 입자의 방출을 촉진할 수 있다. 발현 시 Gag 폴리펩티드는 세포막을 표적화하고 막 출아 동안 XDP에 합체된다. 숙주 세포로부터 바이러스 출아 동안 또는 직후에 HIV-1 프로테아제는 Pr55gag를 성숙한 Gag 단백질 p17 매트릭스(MA), p24 캡시드(CA), p7 뉴클레오캡시드(NC) 및 p6으로 절단한다. Gag의 단백질분해 처리는 XDP 구조에서 주요한 변형을 초래한다: MA는 바이러스 막의 내부 면과 연관된 상태로 유지되는 반면 CA는 응축되어 NC 복합체(합체된 경우) 주위에 쉘을 형성한다. 이 재배열은 감염성 비리온과 유사한 원추형 코어 특성을 가진 입자로 형태학적 전환을 생성한다.
부분적으로 레트로바이러스로부터 유래된 성분이 표적 세포로의 치료 페이로드의 전달을 위한 패키징 세포 내에서 XDP를 생성하기 위해 이용될 수 있다는 것이 발견되었다. 일 실시형태에서, XDP 시스템 플라스미드로 형질전환된 패키징 세포는 표적 핵산의 편집을 수행하기 위해 CasX:gNA 시스템의 캡슐화된 RNP를 세포로 전달하는 것을 촉진하는 XDP를 생성한다.
VI. XDP 발현 시스템 및 XDP를 생산하는 방법
또 다른 양태에서, 본 개시내용은 선택된 숙주 세포에서 발현과 양립가능한 조절 요소에 작동가능하게 연결된 본 명세서에 기재된 XDP 시스템의 핵산을 포함하는 발현 카세트를 포함하는, 선택된 숙주 패키징 세포에서 XDP의 생산에 사용하기 위한 재조합 발현 시스템을 제공한다. 발현 카세트는 본 명세서 및 실시예에 기재된 바와 같은 하나 이상의 벡터에 포함될 수 있고, 동일하거나 상이한 프로모터를 사용할 수 있다. 예시적인 조절 요소는 전사 프로모터 예컨대, 비제한적으로, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, 신장 인자 1 알파(EF1α), MMLV-ltr, 단일 전사체로부터 다중 유전자의 번역을 허용하는 내부 리보솜 진입 부위(IRES) 또는 p2A 펩티드, 메탈로티오네인, 전사 인핸서 요소, 전사 종결 신호, 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 적절한 제어 요소의 선택은 발현되는 인코딩된 성분(예를 들어, 단백질 또는 RNA) 또는 핵산이 상이한 폴리머라제를 필요로 하거나 융합 단백질로 발현되도록 의도되지 않는 다중 성분을 포함하는지 여부에 따라 달라진다는 것이 이해될 것이다.
일부 실시형태에서, 본 개시내용은 치료 페이로드(예를 들어, CasX 단백질 및 gNA의 RNP)를 포함하는 XDP를 제조하는 방법을 제공하며, 상기 방법은 XDP가 캡슐화된 치료 페이로드로 생성된 다음, 하기 또는 실시예에 기재된 패키징 세포에 의해 생성된 XDP를 수확하도록 하는 조건 하에서 본 명세서에 기재된 실시형태 중 임의의 하나의 XDP 시스템을 인코딩하는 발현 카세트 또는 합체된 핵산을 포함하는 본 명세서에 기재된 실시형태의 패키징 세포를 증식시키는 것을 포함한다. 일부 실시형태에서, 패키징 세포는 CasX 및 gNA의 RNP, 및 선택적으로 HDR에 의한 표적 핵산의 편집을 위한 공여자 주형을 포함하는 XDP를 생산한다.
패키징 세포는, 예를 들어, 포유동물 세포(예를 들어, HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2 세포, Saos-2 세포, HuH7 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO 세포, NIH3T3 세포, COS 세포, WI38 세포, MRC5 세포, A549 세포, HeLa 세포, CHO 세포 및 HT1080 세포), 곤충 세포(예를 들어, Trichoplusia ni(Tn5) 또는 Sf9), 박테리아 세포, 식물 세포, 효모 세포, 항원 제시 세포(예를 들어, 일차, 불멸화 또는 종양-유래된 림프 세포 예컨대 대식세포, 단핵구, 수지상 세포, B-세포, T-세포, 줄기 세포, 및 이의 전구 세포)일 수 있다. 패키징 세포는 전기천공법, 양이온성 중합체의 사용, 인산칼슘, 바이러스-매개된 형질감염, 형질도입 또는 리포펙션을 포함한 통상적인 방법으로 형질감염될 수 있다. 일부 실시형태에서, 패키징 세포는 그렇지 않으면 XDP 내에 합체될 세포 표면 마커 또는 수용체를 감소 또는 제거하여 XDP의 투여를 받는 대상체에 의한 세포 표면 마커 또는 수용체에 대한 면역 반응을 감소시키도록 변형될 수 있다.
패키징 세포 내로 벡터의 도입은 Qiagen으로부터 상업적으로 이용가능한 TransMessenger 시약, Stemgent로부터 Stemfect RNA Transfection Kit, 및 Mirus Bio LLC로부터 TransIT-mRNA Transfection Kit, Lonza 뉴클레오펙션, Maxagen 전기천공 등의 하나 이상을 사용할 수 있다. 형질감염, 형질도입 또는 감염을 위한 방법은 당업자에게 잘 알려져 있다.
일 실시형태에서, XDP는 48 내지 96시간 동안 적절한 성장 배지에서 형질감염된 패키징 세포의 인큐베이션에 의해 생성되고 0.45 마이크론 필터를 통한 성장 배지의 여과에 의해 수집된다. 일부 경우에, XDP는 10% 또는 10-30% 밀도 구배 수크로스 완충액에서 원심분리에 의해 추가로 농축될 수 있다. 다른 경우에, XDP는 이온-교환 수지 또는 크기 배제 수지의 사용과 같은 컬럼 크로마토그래피에 의해 농축될 수 있다.
VII. 적용
본 명세서에 제공된 CasX 단백질 및 가이드를 포함하는 XDP 시스템은 세포에서 표적 핵산을 변형시키는 방법에 유용하다. 표적 핵산을 변형하는 XDP 시스템에서, 방법은 본 명세서에 기재된 CasX:gNA 시스템의 임의의 실시형태를 이용하고, 선택적으로 본 명세서에 기재된 공여자 주형 실시형태를 포함한다. 일부 경우에, 방법은 표적 핵산을 포함하는 세포에서 돌연변이체 단백질의 발현을 녹-다운시킨다. 다른 경우에, 방법은 돌연변이체 단백질의 발현을 녹-아웃시킨다. 또 다른 경우에, 방법은 표적 핵산에서 돌연변이를 교정하여 기능성 단백질을 초래한다.
일부 실시형태에서, 방법은 표적 핵산을 포함하는 세포를 표적 핵산에 상보적인 표적화 서열을 포함하는 가이드 핵산(gNA) 및 CasX 단백질의 RNP를 포함하는 XDP의 유효량과 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질에 의한 표적 핵산의 변형을 초래한다. 또 다른 실시형태에서, XDP는 세포를 XDP와 접촉시키는 것이 표적 핵산 서열 내로 공여자 주형의 삽입을 초래하는 공여자 주형을 추가로 포함한다. 일부 경우에, 공여자 주형은 표적 핵산 유전자에서 돌연변이를 교정하기 위해 RNP와 연계하여 사용되는 반면, 다른 경우에는 공여자 주형을 사용하여 표적 핵산 유전자의 발현 생성물의 녹-다운 또는 녹-아웃 발현에 돌연변이를 삽입한다.
일부 실시형태에서, 세포에서 표적 핵산을 변형시키는 방법은 표적 핵산을 포함하는 세포를 유효한 용량의 XDP와 접촉시키는 것을 포함하며 여기서 세포는 시험관내 또는 생체외에서 변형된다.
세포에서 표적 핵산을 변형시키는 방법의 다른 실시형태에서, 세포는 생체내에서 변형되며, 여기서 치료적으로-유효한 용량의 XDP가 대상체에게 투여된다. 방법은 RNP가 AAV와 같은 바이러스 시스템에서 전달되는 핵산에 비해 상대적으로 수명이 짧다는 점에서 바이러스 전달 시스템에 비해 이점이 있다. XDP 시스템의 추가의 이점은 XDP의 향성을 조작함에 의해 시스템을 특정 세포 유형에 매칭하는 능력이다. 일부 실시형태에서, 전달된 RNP의 반감기는 약 24h, 또는 약 48h, 또는 약 72h, 또는 약 96h, 또는 약 120h, 또는 약 1주이다. 치료 방법에 의해, XDP의 투여는 대상체에서 질환과 연관된 하나, 둘 또는 그 이상의 증상, 임상 매개변수 또는 평가변수의 개선을 초래한다.
일부 실시형태에서, XDP가 투여된 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택된다. 특정 실시형태에서, 대상체는 인간이다. 방법의 일 실시형태에서, XDP는 적어도 약 1 x 105 XDP 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 또 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 약 1 x 1016 입자/kg, 또는 적어도 약 1 x 106 입자/kg 내지 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 107 입자/kg 내지 약 1 x 1014 입자/kg의 용량으로 대상체에게 투여된다. 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 일 실시형태에서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 동맥-내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체내, 안내, 유리체내, 림프내, 복강내 경로 및 망막-하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여된다.
또 다른 실시형태에서, 개시내용은 본 명세서에 기재된 임의의 실시형태의 XDP의 치료적으로 유효한 용량을 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따른 질환을 갖는 대상체의 치료 방법을 제공한다. 치료 요법의 일 실시형태에서, 치료적으로 유효한 용량은 단일 용량으로 투여된다. 치료 요법의 또 다른 실시형태에서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 한 번, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여된다.
VIII. 키트 및 제조 물품
또 다른 양태에서, 본 명세서에 기재된 실시형태의 조성물을 포함하는 키트가 본 명세서에 제공된다. 일부 실시형태에서, 키트는 본 명세서에 기재된 임의의 실시형태의 치료 페이로드를 포함하는 XDP, 부형제 및 적합한 용기(예를 들어, 튜브, 바이알 또는 플레이트)를 포함한다. 특정 실시형태에서, 치료 페이로드는 CasX 및 gNA의 RNP이다.
일부 실시형태에서, 키트는 완충액, 뉴클레아제 억제제, 프로테아제 억제제, 리포솜, 치료제, 표지, 표지 시각화 시약, 또는 전기한 것의 임의의 조합을 추가로 포함한다. 일부 실시형태에서, 키트는 약학적으로 허용가능한 담체, 희석제 또는 부형제를 추가로 포함한다. 일부 실시형태에서, 키트는 사용 설명서를 추가로 포함한다.
IX. 예시적인 실시형태
다음의 예시적인 실시형태는 단지 예로서 제공된다.
일부 실시형태에서, XDP 시스템은 표 25에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 91%, 또는 표 26의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 85%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 24에 기재된 바와 같은 플라스미드 pXDP40(서열번호: 882)에 의해 인코딩된 버젼 44를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 25에서 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 37%, 또는 표 26의 편집 검정 희석액에 따라 적어도 5%, 적어도 10% 또는 적어도 13%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 24에 기재된 바와 같은 플라스미드 pXDP62(서열번호: 904)에 의해 인코딩된 버전 63을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 28에서 편집 검정 희석액에 따라 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75% 또는 적어도 77%, 또는 표 29의 편집 검정 희석액에 따라 적어도 20%, 적어도 25%, 적어도 30% 또는 적어도 32%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 27에 기재된 바와 같은 플라스미드 pXDP72(서열번호: 917)에 의해 인코딩된 버전 74a를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 28에서 편집 검정 희석액에 따라 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65% 또는 적어도 67%, 또는 표 29의 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 38%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 27에 기재된 바와 같은 플라스미드 pXDP73(서열번호: 918)에 의해 인코딩된 버전 75a를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 31에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 91%, 또는 표 32의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 85%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 30에 기재된 바와 같은 플라스미드 pXDP40(서열번호: 949)에 의해 인코딩된 버전 44는 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 31에서 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 37%, 또는 표 32의 편집 검정 희석액에 따라 적어도 5%, 적어도 10% 또는 적어도 13%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 30에 기재된 바와 같은 플라스미드 pXDP62(서열번호: 971)에 의해 인코딩된 버전 63을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 34에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 94%, 또는 표 35의 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 95%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 33에 기재된 바와 같은 플라스미드 pXDP127(서열번호: 976)에 의해 인코딩된 버전 102를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 34에서 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 84%, 또는 표 35의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 또는 적어도 80%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP0017에 의해 인코딩된 버전 7을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 37에서 편집 검정 희석액에 따라 적어도 25%, 적어도 25%, 적어도 30% 또는 적어도 33%, 또는 표 38의 편집 검정 희석액에 따라 적어도 1.8%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP78 + pXDP54에 의해 인코딩된 버전 66B를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 37에서 편집 검정 희석액에 따라 적어도 10%, 적어도 15%, 적어도 20% 또는 적어도 21%, 또는 표 38의 편집 검정 희석액에 따라 적어도 5%, 적어도 7% 또는 적어도 9%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP83 + pXDP59에 의해 인코딩된 버전 87B를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
편집 효율은 당업계에 공지된 임의의 방법 또는 검정에 의해 측정될 수 있다. 당업자는 이러한 검정을 식별하고 사용하는 방법을 알고 있을 것이다. 일부 실시형태에서, 편집 효율은, 예를 들어, 도 69-70에 도시된 바와 같이 %TDT 양성 세포로서 측정될 수 있다.
일부 실시형태에서, XDP 시스템은 배열을 포함하지 않는 XDP 시스템과 비교하여 증가된 편집 효율을 초래하는, 상기 배열에 하나 이상의 플라스미드 또는 요소를 포함한다. 일부 실시형태에서, XDP 시스템은 동일한 요소 및/또는 배열을 포함하지 않는 XDP 시스템에 비하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 가질 수 있다.
일부 실시형태에서, XDP 시스템은 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래될 수 있고, Gag-프로테아제-CasX, 당단백질(VSV-G) 및 가이드 RNA(sgRNA)를 인코딩하는 3개 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열될 수 있다(도 52a). 예시적인 실시형태에서, XDP 시스템 버전 44는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하고(도 52a), 여기서 버전 44는 동일한 요소 및/또는 배열을 포함하지 않는 XDP 시스템에 비하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70% , 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 53a에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 63은 MA, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 63은 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 감마레트로바이러스(FLV 및 MMLV)로부터 유래될 수 있고, 도 59b에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, pp12, CA 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 74a는 MA, pp12, CA, 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 74a는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래될 수 있고 도 62b에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, P2A, P2B, P10, CA, NC 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 102는 MA, P2A, P2B, P10, CA, NC 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 102는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 39a에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, CA, NC, p1/p6 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 7은 MA, CA, NC, p1/p6 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 7은 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 56a에 도시된 바와 같이 4개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드 1의 요소는 MA, P2A, P2B, P10, CA 및 CasX로 배열될 수 있고 구조적 플라스미드 2의 요소는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 66B는 MA, P2A, P2B, P10, CA, 및 CasX로 배열된 구조적 플라스미드 1의 요소와 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드 2의 요소를 포함하며, 여기서 버전 66B는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 57a에 도시된 바와 같이 4개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드 1의 요소는 MA, pp21/24, P12/P3/P8, CA 및 CasX로 배열될 수 있고 구조적 플라스미드 2의 요소는 MA, pp21/24, P12/P3/P8, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 87B는 MA, pp21/24, P12/P3/P8, CA, 및 CasX로 배열된 구조적 플라스미드 1의 요소와 MA, pp21/24, P12/P3/P8, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드 2의 요소를 포함하며, 여기서 버전 87B는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
본 명세서에 개시된 XDP 시스템은 오토레트로바이러스아과(렌티바이러스, 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스), 및 스푸마레트로바이러스아과를 포함하는 레트로바이러스과 바이러스 패밀리로부터 유래될 수 있다. 예시적인 XDP 시스템 버전 및 그의 해당하는 바이러스는 표 25, 26, 28, 29, 31, 32, 34, 35, 37 및 38에 나타나있다.
X. 열거된 실시형태
발명은 다음 세트의 열거된 예시적인 실시형태를 참조하여 정의될 수 있다:
세트 I
실시형태 I-1. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질; 및
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산;
c. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제3 핵산:
i) gag 폴리단백질; 및
ii) CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 적어도 하나의 프로테아제를 포함하는 pol 폴리단백질; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-2. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질;
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위; 및
iv) CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산; 및
c. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제3 핵산.
실시형태 I-3. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질; 및
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산;
c. CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제를 인코딩하는 서열을 포함하는 제3 핵산; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-4. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 인코딩하는 서열을 포함하는 제1 핵산
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질; 및
ii) 가이드 RNA 및 가이드 RNA 안으로 삽입된 레트로바이러스 Psi 패키징 요소를 포함하는 키메라 RNA;
b. Cas X 단백질을 인코딩하는 서열을 포함하는 제2 핵산; 및
c. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제3 핵산.
실시형태 I-5. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) RNA 결합 도메인 단백질; 및
iii) gag 폴리단백질과 RNA 결합 도메인 단백질 사이의 선택적 프로테아제 절단 부위;
b. 가이드 RNA 및 CasX 단백질을 인코딩하는 서열을 포함하는 제2 핵산;
c. gag 폴리단백질과 RNA 결합 도메인 단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제를 인코딩하는 서열을 포함하는 제3 핵산; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-6. 실시형태 5에 있어서, RNA 결합 도메인 단백질은 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된, XDP 시스템.
실시형태 I-7. 실시형태 1-3 중 어느 하나에 있어서, 표 8 또는 표 9의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 I-8. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 매트릭스 폴리펩티드(MA)와 캡시드 폴리펩티드(CA) 사이 및/또는 캡시드 폴리펩티드(CA)와 뉴클레오캡시드 폴리펩티드(NC) 사이에 하나 이상의 프로테아제 절단 부위를 포함하고, 여기서 하나 이상의 프로테아제 절단 부위는 프로테아제에 의해 절단되어질 수 있는, XDP 시스템.
실시형태 I-9. 세트 I의 선행하는 실시형태 중 어느 하나에 있에서, 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 MMP-2, -3, -7, -9, -10 및 -11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 I-10. 실시형태 1에 있어서, pol 폴리단백질은 레트로바이러스 폴리단백질인, XDP 시스템.
실시형태 I-11. 실시형태 10에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 또는 렌티바이러스인, XDP 시스템.
실시형태 I-12. 실시형태 11에 있어서, 렌티바이러스는 인간 면역결핍 바이러스(HIV)인, XDP 시스템.
실시형태 I-13. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리단백질은 레트로바이러스 폴리단백질인, XDP 시스템.
실시형태 I-14. 실시형태 13에 있어서, gag 폴리단백질은 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 또는 렌티바이러스로부터 유래되는, XDP 시스템.
실시형태 I-15. 실시형태 14에 있어서, gag 폴리단백질은 렌티바이러스 폴리단백질인, XDP 시스템.
실시형태 I-16. 실시형태 15에 있어서, 렌티바이러스 gag 폴리펩티드는 HIV-1 gag 폴리단백질인, XDP 시스템.
실시형태 I-17. 실시형태 13-16 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 I-18. 실시형태 16 또는 실시형태 17에 있어서, HIV-1 gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, HIV gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
a. MA 폴리펩티드 및 CA 폴리펩티드;
b. CA 폴리펩티드 및 p2 폴리펩티드;
c. p2 폴리펩티드 및 NC 폴리펩티드;
d. NC 폴리펩티드 및 p1 폴리펩티드; 및
e. p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 I-19. 실시형태 18에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 MMP-2, -3, -7, -9, -10 및 -11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 I-20. 실시형태 19에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 I-21. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하고 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 I-22. 실시형태 21에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자의 적어도 일부 또는 표적 핵산 유전자의 조절 요소를 포함하는, XDP 시스템.
실시형태 I-23. 실시형태 21 또는 실시형태 22에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자 또는 표적 핵산 유전자의 조절 요소에서 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 I-24. 실시형태 21 또는 실시형태 22에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자 또는 표적 핵산 유전자의 조절 요소와 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 I-25. 실시형태 24에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 I-26. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 I-27. 실시형태 26에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 597-781로 구성된 서열의 그룹으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 I-28. 실시형태 26 또는 실시형태 27에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-29. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-30. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-31. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-32. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-33. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-34. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-35. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 I-36. 실시형태 35에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 I-37. 실시형태 35 또는 실시형태 36에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 I-38. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 I-39. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군으로부터 선택된 서열에 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 I-40. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 I-41. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 I-42. 실시형태 41에 있어서, 하나 이상의 NLS는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 I-43. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에서 발현되는, CasX 변이체.
실시형태 I-44. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에서 발현되는, CasX 변이체.
실시형태 I-45. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에서 발현되는, CasX 변이체.
실시형태 I-46. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 I-47. 실시형태 1-45 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 I-48. 실시형태 1-45 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 유지하는, XDP 시스템.
실시형태 I-49. 실시형태 48에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
a. 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
b. 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 I-50. 실시형태 49에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 I-51. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 외피 당단백질은 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, 로타바이러스, 노워크 바이러스, 장 아데노바이러스, 파보바이러스, 뎅기열 바이러스, 원숭이 수두, 모노네가바이러스, 광견병 바이러스, 라고스 박쥐 바이러스, 모콜라 바이러스, 듀벤하지 바이러스, 유럽 박쥐 바이러스 1, 유럽 박쥐 바이러스 2, 호주 박쥐 바이러스, 에페메로바이러스, 베시큘로바이러스, 수포성 구내염 바이러스(VSV), 단순 포진 바이러스 유형 1, 단순 포진 바이러스 유형 2, 수두 대상포진, 거대세포 바이러스, 엡스타인-바 바이러스(EBV), 인간 헤르페스바이러스(HHV), 인간 헤르페스바이러스 유형 6, 인간 헤르페스바이러스 유형 8, 인간 면역 결핍 바이러스(HIV), 유두종 바이러스, 뮤어라인 감마헤르페스바이러스, 아르헨티나 출혈열 바이러스, 볼리비아 출혈열 바이러스, 사비아-연관된 출혈열 바이러스, 베네수엘라 출혈열 바이러스, 라사 열 바이러스, 마추포 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 크림-콩고 출혈열 바이러스, 한타바이러스, 리프트 밸리 열 바이러스, 에볼라 출혈열 바이러스, 마르부르크 출혈열 바이러스, 카이사누르 숲병 바이러스, 옴스크 출혈열 바이러스, 진드기-매개 뇌염 유발 바이러스, 헨드라 바이러스, 니파 바이러스, 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 사스-연관된 코로나바이러스(SARS-CoV) 및 웨스트나일 바이러스로 구성된 군으로부터 선택되는 외피 바이러스로부터 유래된, XDP 시스템.
실시형태 I-52. 실시형태 51에 있어서, 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 I-53. 실시형태 1-50 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 I-54. 실시형태 53에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 I-55. 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 I-56. 실시형태 54에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 I-57. 실시형태 55 또는 실시형태 56에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포, 또는 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 I-58. 실시형태 56 또는 실시형태 57에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 I-59. CasX 단백질을 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
a. 실시형태 1-54 중 어느 하나의 XDP 시스템을 실시형태 56-58 중 어느 하나의 패키징 세포 안으로 도입하는 단계;
b. XDP가 생성되도록 하는 조건 하에서 패키징 세포를 번식시키는 단계; 및
c. 패키징 세포에 의해 생산된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 I-60. 실시형태 59의 방법에 의해 생성된 XDP.
실시형태 I-61. 다음을 포함하는 XDP:
a. 레트로바이러스 캡시드(CA), 매트릭스, (MA) 및 뉴클레오캡시드(NC) 폴리펩티드
b. 표적 세포에 대한 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
c. XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 연관된 CasX 단백질 및 가이드 RNA.
실시형태 I-62. 실시형태 61에 있어서, 실시형태 39-50 중 어느 하나의 CasX 및 실시형태 26-38 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 I-63. 위형화 바이러스 외피 당단백질은 실시형태 57 또는 실시형태 58의 패키징 세포 또는 패키징 세포 내로 도입된 당단백질을 인코딩하는 핵산으로부터 유래되는, XDP.
실시형태 I-64. 실시형태 60-63에 있어서, 실시형태 21-25 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 I-65. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 60-64 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX, 가이드 RNA, 및 선택적으로, 공여자 주형 핵산 서열을 세포 안으로 도입하는 것을 포함하여, 표적 핵산 서열의 변형을 초래하는, 방법.
실시형태 I-66. 실시형태 65에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 I-67. 실시형태 65에 있어서, 변형은 표적 핵산 서열에 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 I-68. 실시형태 65-67 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 I-69. 실시형태 65-68 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 I-70. 실시형태 65-68 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 I-71. 실시형태 70에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 I-72. 실시형태 71에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 I-73. 실시형태 71 또는 실시형태 72에 있어서, XDP는 정맥내, 뇌실내, 수조내, 척수강내, 두개내, 요추, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 및 망막-하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여되는, 방법.
실시형태 I-74. 실시형태 71-73 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 I-75. 실시형태 74에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 II
실시형태 II-1. 하기로부터 선택된 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산을 포함하는 CasX 전달 입자(XDP) 시스템:
a. 매트릭스 폴리펩티드(MA);
b. 캡시드 폴리펩티드(CA);
c. 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
d. CasX 단백질;
e. 가이드 핵산(gNA);
f. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
g. RNA 결합 도메인;
h. 프로테아제 절단 부위;
i. gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
j. gag-pol 폴리단백질; 및
k. 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 II-2. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하며, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-3. 실시형태 II-2에 있어서, 여기서
a. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하거나;
b. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하거나; 또는
c. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-4. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-5. 실시형태 II-4에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-6. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-7. 실시형태 II-6에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-8. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-9. 실시형태 II-8에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
c. 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 II-10. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-11. 실시형태 II-10에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
c. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 II-12. 실시형태 II-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내에 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 II-13. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-14. 실시형태 II-13에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
c. 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-15. 실시형태 II-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-16. 실시형태 II-15에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
d. 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 II-17. 실시형태 II-15 또는 실시형태 II-16에 있어서, 개재하는 프로테아제 절단 부위와 함께 MA와 CasX 단백질 성분 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 II-18. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-19. 실시형태 II-18에 있어서, 여기서
a. 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
b. 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
c. 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 II-20. 실시형태 II-2 또는 실시형태 II-3에 있어서, 표 6의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 II-21. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 II-22. 실시형태 II-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 II-23. 실시형태 II-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 II-24. 실시형태 II-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 II-25. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 II-26. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
a. MA 폴리펩티드 및 CA 폴리펩티드;
b. CA 폴리펩티드 및 p2 폴리펩티드;
c. p2 폴리펩티드 및 NC 폴리펩티드;
d. NC 폴리펩티드 및 p1 폴리펩티드; 및
e. p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 II-27. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 II-28. 실시형태 II-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 II-29. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 II-30. 실시형태 II-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 II-31. 실시형태 II-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 II-32. 실시형태 II-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 II-33. 실시형태 II-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 II-34. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 II-35. 실시형태 II-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 II-36. 실시형태 II-29 또는 실시형태 II-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 연속적인 뉴클레오티드로 이루어진, XDP 시스템.
실시형태 II-37. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 20개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-38. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 19개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-39. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 18개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-40. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 17개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-41. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 16개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-42. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 15개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-43. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 II-44. 실시형태 II-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 II-45. 실시형태 II-43 또는 실시형태 II-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 II-46. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형되는, XDP 시스템.
실시형태 II-47. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 II-48. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 II-49. 실시형태 II-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화성은 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화성과 비교하여 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 II-50. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 II-51. 실시형태 II-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 II-52. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합되는, CasX 변이체.
실시형태 II-53. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합되는, CasX 변이체.
실시형태 II-54. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합되는, CasX 변이체.
실시형태 II-55. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 II-56. 실시형태 II-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 II-57. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 II-58. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 II-59. 실시형태 II-58에 있어서, 공여자 주형은 표적 핵산에서 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 II-60. 실시형태 II-58 또는 실시형태 II-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 II-61. 실시형태 II-58 또는 실시형태 II-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산과 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 II-62. 실시형태 II-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 II-63. 실시형태 II-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 II-64. 실시형태 II-63에 있어서, dCasX는 다음의 잔기에서 돌연변이를 포함하는, XDP 시스템:
a. 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
b. 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 II-65. 실시형태 II-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 II-66. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 II-67. 실시형태 II-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 II-68. 실시형태 II-66 또는 실시형태 II-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 II-69. 실시형태 II-67 또는 실시형태 II-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 II-70. 실시형태 II-66-69 중 어느 하나에 있어서, 실시형태 II-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 II-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
a. XDP가 생성되도록 하는 조건 하에서 실시형태 II-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
b. 패키징 세포에 의해 생산된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 II-72. 실시형태 II-71의 방법에 의해 생성된 XDP.
실시형태 II-73. 다음 중에서 선택된 하나 이상의 성분을 포함하는 XDP:
a. 매트릭스 폴리펩티드(MA);
b. 캡시드 폴리펩티드(CA);
c. 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
d. CasX 단백질;
e. 가이드 핵산(gNA);
f. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
g. RNA 결합 도메인;
실시형태 II-74. 실시형태 II-73에 있어서, XDP는
a. 매트릭스 폴리펩티드(MA);
b. 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
c. XDP에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 II-75. 실시형태 II-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 II-76. 실시형태 II-74 또는 실시형태 II-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 II-77. 실시형태 II-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 II-78. 실시형태 II-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 II-79. 실시형태 II-74-78 중 어느 하나에 있어서, CasX 및 gNA는 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 II-80. 실시형태 II-74-79 중 어느 하나에 있어서, 실시형태 II-47-65 중 어느 하나의 CasX 및 실시형태 II-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 II-81. 실시형태 II-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 II-82. 실시형태 II-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, 로타바이러스, 노워크 바이러스, 장 아데노바이러스, 파보바이러스, 뎅기열 바이러스, 원숭이 수두, 모노네가바이러스, 광견병 바이러스, 라고스 박쥐 바이러스, 모콜라 바이러스, 듀벤하지 바이러스, 유럽 박쥐 바이러스 1, 유럽 박쥐 바이러스 2, 호주 박쥐 바이러스, 에페메로바이러스, 베시큘로바이러스, 수포성 구내염 바이러스(VSV), 단순 포진 바이러스 유형 1, 단순 포진 바이러스 유형 2, 수두 대상포진, 거대세포 바이러스, 엡스타인-바 바이러스(EBV), 인간 헤르페스바이러스(HHV), 인간 헤르페스바이러스 유형 6, 인간 헤르페스바이러스 유형 8, 인간 면역 결핍 바이러스(HIV), 유두종 바이러스, 뮤어라인 감마헤르페스바이러스, 아르헨티나 출혈열 바이러스, 볼리비아 출혈열 바이러스, 사비아-연관된 출혈열 바이러스, 베네수엘라 출혈열 바이러스, 라사 열 바이러스, 마추포 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 크림-콩고 출혈열 바이러스, 한타바이러스, 리프트 밸리 열 바이러스, 에볼라 출혈열 바이러스, 마르부르크 출혈열 바이러스, 카이사누르 숲병 바이러스, 옴스크 출혈열 바이러스, 진드기-매개 뇌염 유발 바이러스, 헨드라 바이러스, 니파 바이러스, 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 사스-연관된 코로나바이러스(SARS-CoV) 및 웨스트나일 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 II-83. 실시형태 II-73-82 중 어느 하나에 있어서, 실시형태 II-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는 XDP.
실시형태 II-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 II-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하고, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA, 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 II-85. 실시형태 II-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 II-86. 실시형태 II-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 II-87. 실시형태 II-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 II-88. 실시형태 II-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 II-89. 실시형태 II-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 II-90. 실시형태 II-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 II-91. 실시형태 II-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 II-92. 실시형태 II-90 또는 실시형태 II-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법
실시형태 II-93. 실시형태 II-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 II-94. 실시형태 II-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 II-95. RNP가 세포에 들어가도록 세포를 실시형태 II-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 II-96. 실시형태 II-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 II-97. 실시형태 II-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 II-98. 실시형태 II-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 II-99. 실시형태 II-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 II-100. 실시형태 II-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 II-101. 실시형태 II-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 II-102. 실시형태 II-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 II-103. 실시형태 II-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 III
실시형태 III-1. 다음으로부터 선택된 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산을 포함하는 CasX 전달 입자(XDP) 시스템:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
(g) RNA 결합 도메인;
(h) 프로테아제 절단 부위;
(i) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(j) gag-pol 폴리단백질; 및
(k) 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 III-2. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-3. 실시형태 III-2에 있어서, 여기서
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(b) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-4. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템,
실시형태 III-5. 실시형태 III-4에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-6. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-7. 실시형태 III-6에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-8. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-9. 실시형태 III-8에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 III-10. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-11. 실시형태 III-10에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 III-12. 실시형태 III-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 III-13. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-14. 실시형태 III-13에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-15. 실시형태 III-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-16. 실시형태 III-15에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이에 개재된 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
(d) 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 III-17. 실시형태 III-15 또는 실시형태 III-16에 있어서, 개재하는 프로테아제 절단 부위와 함께 MA와 CasX 단백질 성분 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 III-18. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-19. 실시형태 III-18에 있어서, 여기서
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
(b) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 III-20. 실시형태 III-2 또는 실시형태 III-3에 있어서, 표 6의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 III-21. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 III-22. 실시형태 III-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 III-23. 실시형태 III-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 III-24. 실시형태 III-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 III-25. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 III-26. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
(a) MA 폴리펩티드 및 CA 폴리펩티드;
(b) CA 폴리펩티드 및 p2 폴리펩티드;
(c) p2 폴리펩티드 및 NC 폴리펩티드;
(d) NC 폴리펩티드 및 p1 폴리펩티드; 및
(e) p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 III-27. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는. XDP 시스템.
실시형태 III-28. 실시형태 III-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 III-29. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 III-30. 실시형태 III-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 III-31. 실시형태 III-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 포함하는, XDP 시스템.
실시형태 III-32. 실시형태 III-실시형태 III-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 III-33. 실시형태 III-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 III-34. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 III-35. 실시형태 III-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 III-36. 실시형태 III-29 또는 실시형태 III-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-37. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-38. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-39. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-40. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-41. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-42. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-43. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 III-44. 실시형태 III-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합된, XDP 시스템.
실시형태 III-45. 실시형태 III-43 또는 실시형태 III-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 III-46. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 III-47. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 III-48. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택되는 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 III-49. 실시형태 III-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화도는 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화도에 비해 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 III-50. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 III-51. 실시형태 III-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 III-52. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합된, CasX 변이체.
실시형태 III-53. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합된, CasX 변이체.
실시형태 III-54. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합된, CasX 변이체.
실시형태 III-55. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 III-56. 실시형태 III-실시형태 III-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 III-57. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 III-58. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 III-59. 실시형태 III-58에 있어서, 공여자 주형은 표적 핵산에서의 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 III-60. 실시형태 III-58 또는 실시형태 III-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 III-61. 실시형태 III-58 또는 실시형태 III-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산과 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 III-62. 실시형태 III-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 III-63. 실시형태 III-실시형태 III-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, 여기서 dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 III-64. 실시형태 III-63에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
(a) 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
(b) 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 III-65. 실시형태 III-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 III-66. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 III-67. 실시형태 III-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 III-68. 실시형태 III-실시형태 III-66 또는 실시형태 III-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 III-69. 실시형태 III-67 또는 실시형태 III-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 III-70. 실시형태 III-실시형태 III-66-69 중 어느 하나에 있어서, 실시형태 III-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 통합되는, 진핵 세포.
실시형태 III-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 III-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 III-72. 실시형태 III-71의 방법에 의해 생성된 XDP.
실시형태 III-73. 다음으로부터 선택된 하나 이상의 성분을 포함하는 XDP:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(g) RNA 결합 도메인;
실시형태 III-74. 실시형태 III-73에 있어서, XDP는
(a) 매트릭스 폴리펩티드(MA);
(b) 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(c) XDP 내에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 III-75. 실시형태 III-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 III-76. 실시형태 III-74 또는 실시형태 III-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 III-77. 실시형태 III-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 III-78. 실시형태 III-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 III-79. 실시형태 III-74-78 중 어느 하나에 있어서, CasX 및 gNA가 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 III-80. 실시형태 III-74-79 중 어느 하나에 있어서, 실시형태 III-47-65 중 어느 하나의 CasX 및 실시형태 III-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 III-81. 실시형태 III-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 III-82. 실시형태 III-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 III-83. 실시형태 III-73-82 중 어느 하나에 있어서, 실시형태 III-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 III-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 III-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 III-85. 실시형태 III-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 III-86. 실시형태 III-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 III-87. 실시형태 III-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 III-88. 실시형태 III-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 III-89. 실시형태 III-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 III-90. 실시형태 III-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 III-91. 실시형태 III-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 III-92. 실시형태 III-90 또는 실시형태 III-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 III-93. 실시형태 III-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 III-94. 실시형태 III-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 III-95. RNP가 세포에 들어가도록 세포를 실시형태 III-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 III-96. 실시형태 III-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 III-97. 실시형태 III-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 III-98. 실시형태 III-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 III-99. 실시형태 III-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 III-100. 실시형태 III-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 III-101. 실시형태 III-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 III-102. 실시형태 III-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 III-103. 실시형태 III-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 IV
실시형태 IV-1. (a) 내지 (o)로부터 선택된 하나 이상의 성분을 인코딩하거나 (a) 내지 (o)로부터 선택된 성분의 하나 이상의 부분을 인코딩하는 서열을 포함하는 하나 이상의 핵산 및 CasX를 위한 전달 입자(XDP) 시스템:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 뉴셀로캡시드 폴리펩티드(NC);
(d) p1 스페이서 펩티드;
(e) p2 스페이서 펩티드;
(f) p6 스페이서 펩티드;
(g) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1 스페이서, 및 p6 스페이서를 포함하는 gag 폴리단백질;
(h) CasX 단백질;
(i) 가이드 핵산(gNA);
(j) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
(k) RNA 결합 도메인;
(l) 프로테아제 절단 부위;
(m) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(n) gag-pol 폴리단백질; 및
(o) 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 IV-2. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하며, 여기서 성분들은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-3. 실시형태 IV-2에 있어서,
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이에 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(b) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-4. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-5. 실시형태 IV-4에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-6. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-7. 실시형태 IV-6에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-8. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-9. 실시형태 IV-8에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 IV-10. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-11. 실시형태 IV-10에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 IV-12. 실시형태 IV-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 IV-13. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-14. 실시형태 IV-13에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-15. 실시형태 IV-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-16. 실시형태 IV-15에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이에 개재된 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
(d) 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 IV-17. 실시형태 IV-15 또는 실시형태 IV-16에 있어서, 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질 성분과 MA 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 IV-18. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-19. 실시형태 IV-18에 있어서,
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
(b) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 IV-20. 실시형태 IV-2 또는 실시형태 IV-3에 있어서, 표 6-8의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 IV-21. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 IV-22. 실시형태 IV-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 IV-23. 실시형태 IV-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스( FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 IV-24. 실시형태 IV-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 IV-25. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 IV-26. 실시형태 IV-1 내지 25 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
(a) MA 폴리펩티드 및 CA 폴리펩티드;
(b) CA 폴리펩티드 및 p2 폴리펩티드;
(c) p2 폴리펩티드 및 NC 폴리펩티드;
(d) NC 폴리펩티드 및 p1 폴리펩티드; 및
(e) p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 IV-27. 실시형태 IV-1 내지 26 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 IV-28. 실시형태 IV-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 IV-29. 실시형태 IV-1 내지 28 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 IV-30. 실시형태 IV-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템
실시형태 IV-31. 실시형태 IV-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 IV-32. 실시형태 IV-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대해 결합 친화성을 갖는, XDP 시스템.
실시형태 IV-33. 실시형태 IV-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 IV-34. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 IV-35. 실시형태 IV-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 IV-36. 실시형태 IV-29 또는 실시형태 IV-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-37. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-38. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-39. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-40. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-41. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-42. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-43. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 IV-44. 실시형태 IV-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 IV-45. 실시형태 IV-43 또는 실시형태 IV-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 IV-46. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 IV-47. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 IV-48. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 IV-49. 실시형태 IV-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화성은 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화성과 비교하여 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 IV-50. 실시형태 IV-1 내지 49 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 IV-51. 실시형태 IV-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 IV-52. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합되는, CasX 변이체.
실시형태 IV-53. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합되는, CasX 변이체.
실시형태 IV-54. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합되는, CasX 변이체.
실시형태 IV-55. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 IV-56. 실시형태 IV-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 IV-57. 실시형태 IV-1 내지 56 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 IV-58. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 IV-59. 실시형태 IV-58에 있어서, 공여자 주형은 표적 핵산에서 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 IV-60. 실시형태 IV-58 또는 실시형태 IV-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 IV-61. 실시형태 IV-58 또는 실시형태 IV-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 IV-62. 실시형태 IV-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 IV-63. 실시형태 IV-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, 여기서 dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 IV-64. 실시형태 IV-63에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
(a) 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
(b) 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 IV-65. 실시형태 IV-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 IV-66. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 IV-67. 실시형태 IV-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 IV-68. 실시형태 IV-66 또는 실시형태 IV-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 IV-69. 실시형태 IV-67 또는 실시형태 IV-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 IV-70. 실시형태 IV-66-69 중 어느 하나에 있어서, 실시형태 IV-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부가 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 IV-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 IV-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 IV-72. 실시형태 IV-71의 방법에 의해 생성된 XDP.
실시형태 IV-73. 다음 중에서 선택된 하나 이상의 성분을 포함하는 XDP:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(g) RNA 결합 도메인;
실시형태 IV-74. 실시형태 IV-73에 있어서, XDP는
(a) 매트릭스 폴리펩티드(MA);
(b) 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(c) XDP 내에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 IV-75. 실시형태 IV-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 IV-76. 실시형태 IV-74 또는 실시형태 IV-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 IV-77. 실시형태 IV-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 IV-78. 실시형태 IV-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 IV-79. 실시형태 IV-74-78 중 어느 하나에 있어서, CasX 및 gNA는 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 IV-80. 실시형태 IV-74-79 중 어느 하나에 있어서, 실시형태 IV-47-65 중 어느 하나의 CasX 및 실시형태 IV-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 IV-81. 실시형태 IV-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 IV-82. 실시형태 IV-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 IV-83. 실시형태 IV-73-82 중 어느 하나에 있어서, 실시형태 IV-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 IV-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 IV-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA 및, 선택적으로, 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 IV-85. 실시형태 IV-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 IV-86. 실시형태 IV-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 IV-87. 실시형태 IV-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 IV-88. 실시형태 IV-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 IV-89. 실시형태 IV-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 IV-90. 실시형태 IV-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 IV-91. 실시형태 IV-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 IV-92. 실시형태 IV-90 또는 실시형태 IV-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 IV-93. 실시형태 IV-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 IV-94. 실시형태 IV-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 IV-95. RNP가 세포에 들어가도록 세포를 실시형태 IV-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 IV-96. 실시형태 IV-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 IV-97. 실시형태 IV-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 IV-98. 실시형태 IV-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 IV-99. 실시형태 IV-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 IV-100. 실시형태 IV-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 IV-101. 실시형태 IV-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 IV-102. 실시형태 IV-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 IV-103. 실시형태 IV-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 V
실시형태 V-1. 다음을 인코딩하는 하나 이상의 핵산을 포함하는 전달 입자(XDP) 시스템:
(a) 하나 이상의 레트로바이러스 성분;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-2. 실시형태 V-1에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-3. 실시형태 V-2에 있어서, 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-4. 실시형태 V-2에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-5. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질과 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-6. 실시형태 V-5에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-7. 실시형태 V-6에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-8. 실시형태 V-7에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-9. 실시형태 V-8에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-10. 실시형태 V-9에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-11. 실시형태 V-5에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 시스템.
실시형태 V-12. 실시형태 V-11에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-13. 실시형태 V-12에 있어서, 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-14. 실시형태 V-13에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-15. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 핵산은:
(a) 레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 하나 이상의 프로테아제 절단 부위;
(c) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(d) 레트로바이러스 gag-pol 폴리단백질; 및
(e) 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
실시형태 V-16. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 하나 이상의 레트로바이러스 성분은 오르토레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 시스템.
실시형태 V-17. 실시형태 V-16에 있어서, 오르소레트로바이러스아과 바이러스가 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-18. 실시형태 V-16에 있어서, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-19. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-20. 실시형태 V-19에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-21. 실시형태 V-19 또는 실시형태 V-20에 있어서, 하나 이상의 레트로바이러스 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782 및 234-339로 구성된 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-22. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-23. 실시형태 V-22에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-24. 실시형태 V-23에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및 선택적으로 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-25. 실시형태 V-22에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-26. 실시형태 V-25에 있어서, 향성 인자는 XDP와 표적 세포의 세포 표면과의 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-27. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-28. 실시형태 V-27에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-29. 실시형태 V-28에 있어서, gag 폴리단백질은 N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-30. 실시형태 V-27-29 중 어느 하나에 있어서, 하나 이상의 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-31. 실시형태 V-27-30 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-32. 실시형태 V-31에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-33. 실시형태 V-31에 있어서, 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 서열의 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-34. 실시형태 V-33에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G이고, 선택적으로 VSV-G 당단백질은 서열번호: 438의 서열을 포함하는, XDP 시스템.
실시형태 V-35. 실시형태 V-27-34 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-36. 실시형태 V-35에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-37. 실시형태 V-36에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-38. 실시형태 V-37에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-39. 실시형태 V-38에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-40. 실시형태 V-39에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-41. 실시형태 V-39에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-42. 실시형태 V-39-41 중 어느 하나에 있어서, CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK(서열번호: 131), PAAKRVKLD(서열번호: 132), RQRRNELKRSP(서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호: 135), VSRKRPRP(서열번호: 136), PPKKARED(서열번호: 137), PQPKKKPL(서열번호: 138), SALIKKKKKMAP(서열번호: 139), DRLRR(서열번호: 140), PKQKKRK(서열번호: 141), RKLKKKIKKL(서열번호: 142), REKKKFLKRR(서열번호: 143), KRKGDEVDGVDEVAKKKSKK(서열번호: 144), RKCLQAGMNLEARKTKK(서열번호: 145), PRPRKIPR(서열번호: 146), PPRKKRTVV(서열번호: 147), NLSKKKKRKREK(서열번호: 148), RRPSRPFRKP(서열번호: 149), KRPRSPSS(서열번호: 150), KRGINDRNFWRGENERKTR(서열번호: 151), PRPPKMARYDN(서열번호: 152), KRSFSKAF(서열번호: 153), KLKIKRPVK(서열번호: 154), PKTRRRPRRSQRKRPPT(서열번호: 156), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157), PKKKRKVPPPPAAKRVKLD(서열번호: 155), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로 구성된 서열의 군으로부터 선택되는 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-43. 실시형태 V-35에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-44. 실시형태 V-43에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-45. 실시형태 V-44에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-46. 실시형태 V-45에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-47. 실시형태 V-44-46 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-48. 실시형태 V-27-47 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-49. 실시형태 V-48에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성된, XDP 시스템.
실시형태 V-50. 실시형태 V-48 또는 실시형태 V-49에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-51. 실시형태 V-27-50 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-52. 실시형태 V-51에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-53. 실시형태 V-52에 있어서, 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-54. 실시형태 V-51에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-55. 실시형태 V-54에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-56. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-57. 실시형태 V-56에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-58. 실시형태 V-56에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-59. 실시형태 V-56-58 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
실시형태 V-60. 실시형태 V-56-59 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-61. 실시형태 V-60에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-62. 실시형태 V-61에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-63. 실시형태 V-62에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-64. 실시형태 V-56-63 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-65. 실시형태 V-64에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-66. 실시형태 V-65에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-67. 실시형태 V-66에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-68. 실시형태 V-67에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-69. 실시형태 V-68에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397, 또는 11의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-70. 실시형태 V-68에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-71. 실시형태 V-68-70 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-72. 실시형태 V-64에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성되는 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-73. 실시형태 V-72에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-74. 실시형태 V-73에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-75. 실시형태 V-73에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-76. 실시형태 V-73-75 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-77. 실시형태 V-56-76 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-78. 실시형태 V-77에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-79. 실시형태 V-77 또는 실시형태 V-78에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-80. 실시형태 V-56-79 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-81. 실시형태 V-80에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-82. 실시형태 V-81에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-83. 실시형태 V-80에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-84. 실시형태 V-83에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-85. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-86. 실시형태 V-85에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-87. 실시형태 V-86에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-88. 실시형태 V-85-87 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-89. 실시형태 V-85-88 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-90. 실시형태 V-89에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-91. 실시형태 V-89에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-92. 실시형태 V-91에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-93. 실시형태 V-85-92 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-94. 실시형태 V-93에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-95. 실시형태 V-94에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-96. 실시형태 V-95에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-97. 실시형태 V-96에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-98. 실시형태 V-97에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-99. 실시형태 V-97에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-100. 실시형태 V-97-99 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-101. 실시형태 V-93에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-102. 실시형태 V-101에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-103. 실시형태 V-102에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-104. 실시형태 V-102에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-105. 실시형태 V-102-104 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-106. 실시형태 V-85-105 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-107. 실시형태 V-106에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-108. 실시형태 V-106 또는 실시형태 V-107에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-109. 실시형태 V-85-108 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-110. 실시형태 V-109에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-111. 실시형태 V-110에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-112. 실시형태 V-109에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-113. 실시형태 V-112에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-114. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-115. 실시형태 V-114에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-116. 실시형태 V-114에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-117. 실시형태 V-114-116 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-118. 실시형태 V-114-117 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-119. 실시형태 V-118에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-120. 실시형태 V-118에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-121. 실시형태 V-120에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-122. 실시형태 V-114-121 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-123. 실시형태 V-122에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-124. 실시형태 V-123에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-125. 실시형태 V-124에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-126. 실시형태 V-125에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-127. 실시형태 V-126에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-128. 실시형태 V-126에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-129. 실시형태 V-126-128 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-130. 실시형태 V-122에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-131. 실시형태 V-130에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-132. 실시형태 V-131에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-133. 실시형태 V-131에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-134. 실시형태 V-131-133 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-135. 실시형태 V-114-134 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-136. 실시형태 V-135에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-137. 실시형태 V-135 또는 실시형태 V-136에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-138. 실시형태 V-114-137 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-139. 실시형태 V-138에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-140. 실시형태 V-139에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-141. 실시형태 V-139에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-142. 실시형태 V-141에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-143. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 감마레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-144. 실시형태 V-143에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-145. 실시형태 V-144에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-146. 실시형태 V-143-145 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-147. 실시형태 V-143-146 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-148. 실시형태 V-147에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-149. 실시형태 V-147에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-150. 실시형태 V-149에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-151. 실시형태 V-143-150 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-152. 실시형태 V-151에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-153. 실시형태 V-152에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-154. 실시형태 V-153에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-155. 실시형태 V-154에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-156. 실시형태 V-155에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-157. 실시형태 V-155에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-158. 실시형태 V-155-157 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-159. 실시형태 V-151에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-160. 실시형태 V-159에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-161. 실시형태 V-160에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-162. 실시형태 V-160에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-163. 실시형태 V-160-162 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-164. 실시형태 V-143-163 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-165. 실시형태 V-164에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-166. 실시형태 V-164 또는 실시형태 V-165에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-167. 실시형태 V-164-166 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-168. 실시형태 V-167에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-169. 실시형태 V-168에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-170. 실시형태 V-167에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-171. 실시형태 V-170에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-172. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 렌티바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-173. 실시형태 V-172에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-174. 실시형태 V-173에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드를 포함하는, XDP 시스템.
실시형태 V-175. 실시형태 V-172-173 중 어느 하나에 있어서, 핵산은
(a) Gag-Pol 폴리단백질;
(b) 하나 이상의 프로테아제 절단 부위;
(c) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(d) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-176. 실시형태 V-172-175 중 어느 하나에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-177. 실시형태 V-176에 있어서, 렌티바이러스는 HIV-1인, XDP 시스템
실시형태 V-178. 실시형태 V-172-177 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-179. 실시형태 V-178에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-180. 실시형태 V-178에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-181. 실시형태 V-180에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-182. 실시형태 V-172-181 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-183. 실시형태 V-182에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-184. 실시형태 V-183에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-185. 실시형태 V-184에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-186. 실시형태 V-185에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-187. 실시형태 V-186에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-188. 실시형태 V-186에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-189. 실시형태 V-186-188 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-190. 실시형태 V-182에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-191. 실시형태 V-190에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-192. 실시형태 V-191에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-193. 실시형태 V-191에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-194. 실시형태 V-191-193 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-195. 실시형태 V-172-194 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-196. 실시형태 V-195에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-197. 실시형태 V-195 또는 실시형태 V-196에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-198. 실시형태 V-195-197 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-199. 실시형태 V-198에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-200. 실시형태 V-198에 있어서, 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-201. 실시형태 V-198에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-202. 실시형태 V-201에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-203. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-204. 실시형태 V-203에 있어서, gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-205. 실시형태 V-204에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드를 포함하는, XDP 시스템.
실시형태 V-206. 실시형태 V-203-205 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-207. 실시형태 V-203-206 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-208. 실시형태 V-207에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-209. 실시형태 V-207에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-210. 실시형태 V-209에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-211. 실시형태 V-203-210 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-212. 실시형태 V-211에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-213. 실시형태 V-212에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-214. 실시형태 V-213에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-215. 실시형태 V-214에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-216. 실시형태 V-215에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-217. 실시형태 V-216에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-218. 실시형태 V-203-217 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-219. 실시형태 V-211에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-220. 실시형태 V-219에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-221. 실시형태 V-220에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-222. 실시형태 V-221에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-223. 실시형태 V-220-222 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-224. 실시형태 V-203-223 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-225. 실시형태 V-224에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-226. 실시형태 V-224 또는 실시형태 V-225에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-227. 실시형태 V-224-226 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-228. 실시형태 V-227에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-229. 실시형태 V-228에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-230. 실시형태 V-227에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-231. 실시형태 V-230에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-232. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리단백질 및 치료 페이로드는 융합 단백질로서 발현되는, XDP 시스템.
실시형태 V-233. 실시형태 V-232에 있어서, 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하지 않는, XDP 시스템.
실시형태 V-234. 실시형태 V-232에 있어서, 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
실시형태 V-235. 실시형태 V-232-234 중 어느 하나에 있어서, 융합 단백질은 gag 폴리단백질의 성분 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
실시형태 V-236. 실시형태 V-234 및/또는 실시형태 V-235에 있어서, 절단 부위는 Gag-Pol 폴리단백질의 프로테아제, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제, 또는 비-레트로바이러스 이종성 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-237. 실시형태 V-236에 있어서, 절단 부위는 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-238. 실시형태 V-236에 있어서, 절단 부위는 Gag-Pol 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-239. 실시형태 V-236에 있어서, 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-240. 실시형태 V-239에 있어서, 비-레트로바이러스 이종성 프로테아제는 PreScission(HRV3C 프로테아제)인, XDP 시스템.
실시형태 V-241. 실시형태 V-239에 있어서, 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV)인, XDP 시스템.
실시형태 V-242. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 V-243. 실시형태 V-242에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 V-244. 실시형태 V-242 또는 실시형태 V-243에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 V-245. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 V-246. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 Psi 패키징 요소, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 또는 가매듭으로 구성된 군으로부터 선택된 요소를 포함하고, 여기서 요소는 MS2, PP7, Q베타, U1A 및 파지 R-고리로 구성된 군에서 선택된 CasX 내로 합체된 단백질에 대해 친화성을 갖는, XDP 시스템.
실시형태 V-247. 세트 V의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 V-248. 실시형태 V-247에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 V-249. 실시형태 V-247 또는 실시형태 V-248에 있어서, 진핵세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 V-250. 실시형태 V-248 또는 실시형태 V-249에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 V-251. 실시형태 V-247-250 중 어느 하나에 있어서, XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 V-252. 치료 페이로드를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 V-248-251 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 V-253. 실시형태 V-252의 방법에 의해 생성된 XDP.
실시형태 V-254. 실시형태 V-253에 있어서, CasX 및 가이드 RNA의 RNP의 치료 페이로드 및, 선택적으로, 공여자 주형을 포함하는, XDP.
실시형태 V-255. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 세포를 실시형태 V-254의 XDP와 접촉시키는 것을 포함하며, 여기서 상기 접촉은 RNP 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하는 것을 포함하고, 여기서 가이드 RNA에 의해 표적화된 표적 핵산은 CasX에 의해 변형되는, 방법.
실시형태 V-256. 실시형태 V-255에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 V-257. 실시형태 V-255에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 V-258. 실시형태 V-255-257 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 V-259. 실시형태 V-255-258 중 어느 하나에 있어서, 세포는 시험관내 또는 생체외에서 변형되는, 방법.
실시형태 V-260. 실시형태 V-255-258 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 V-261. 실시형태 V-260에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 V-262. 실시형태 V-261에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 V-263. 실시형태 V-261 또는 실시형태 V-262에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 V-264. 실시형태 V-261-263 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 V-265. 실시형태 V-264에 있어서, XDP는 적어도 약 1 x 10^5 입자/kg, 또는 적어도 약 1 x 10^6 입자/kg, 또는 적어도 약 1 x 10^7 입자/kg, 또는 적어도 약 1 x 10^8 입자/kg, 또는 적어도 약 1 x 10^9 입자/kg, 또는 적어도 약 1 x 10^10 입자/kg, 또는 적어도 약 1 x 10^11 입자/kg, 또는 적어도 약 1 x 10^12 입자/kg, 또는 적어도 약 1 x 10^13 입자/kg, 또는 적어도 약 1 x 10^14 입자/kg, 또는 적어도 약 1 x 10^15 입자/kg, 또는 적어도 약 1 x 10^16 입자/kg의 용량으로 투여되는, 방법.
실시형태 V-266. 실시형태 V-261-265 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량의 XDP를 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따라 대상체에게 투여되는, 방법.
실시형태 V-267. 실시형태 V-266에 있어서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여되는, 방법.
실시형태 V-268. RNP가 세포에 들어가도록 세포를 실시형태 V-253 또는 실시형태 V-254의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 V-269. 실시형태 V-268에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 V-270. 실시형태 V-269에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 V-271. 실시형태 V-268-270 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 V-272. 실시형태 V-268-270 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 V-273. 실시형태 V-272에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 V-274. 실시형태 V-273에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 V-275. 실시형태 V-272-274 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 V-276. 실시형태 V-275에 있어서, XDP는 적어도 약 1 x 10^5 입자/kg, 또는 적어도 약 1 x 10^6 입자/kg, 또는 적어도 약 1 x 10^7 입자/kg, 또는 적어도 약 1 x 10^8 입자/kg, 또는 적어도 약 1 x 10^9 입자/kg, 또는 적어도 약 1 x 10^10 입자/kg, 또는 적어도 약 1 x 10^11 입자/kg, 또는 적어도 약 1 x 10^12 입자/kg, 또는 적어도 약 1 x 10^13 입자/kg, 또는 적어도 약 1 x 10^14 입자/kg, 또는 적어도 약 1 x 10^15 입자/kg, 또는 적어도 약 1 x 10^16 입자/kg의 용량으로 투여되는, 방법.
실시형태 V-277. 다음을 포함하는 XDP 입자:
(a) 레트로바이러스 기질(MA) 폴리펩티드;
(b) XDP 내에 캡슐화된 치료 페이로드; 및
(c) XDP 표면 상에 합체된 향성 인자.
실시형태 V-278. 실시형태 V-277에 있어서,
(a) 캡시드 폴리펩티드(CA);
(b) 뉴클레오캡시드 폴리펩티드(NC);
(c) P2A 펩티드, P2B 펩티드;
(d) P10 펩티드;
(e) p12 펩티드
(f) PP21/24 펩티드;
(g) P12/P3/P8 펩티드;
(h) P20 펩티드;
(i) p1 펩티드; 및
(j) p6 펩티드로부터 선택된 하나 이상의 레트로바이러스 성분을 추가로 포함하는, XDP 입자.
실시형태 V-279. 실시형태 V-277 또는 실시형태 V-278에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-280. 실시형태 V-279에 있어서, 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 입자.
실시형태 V-281. 실시형태 V-279에 있어서, 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 입자.
실시형태 V-282. 실시형태 V-277-281 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 입자.
실시형태 V-283. 실시형태 V-282에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-284. 실시형태 V-283에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 입자.
실시형태 V-285. 실시형태 V-284에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 입자.
실시형태 V-286. 실시형태 V-285에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 입자.
실시형태 V-287. 실시형태 V-286에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 입자.
실시형태 V-288. 실시형태 V-282에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 입자.
실시형태 V-289. 실시형태 V-288에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 입자.
실시형태 V-290. 실시형태 V-289에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 입자.
실시형태 V-291. 실시형태 V-290에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 입자.
실시형태 V-292. 실시형태 V-286-291 중 어느 하나에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 입자.
실시형태 V-293. 실시형태 V-277-292 중 어느 하나에 있어서, 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 입자.
실시형태 V-294. 실시형태 V-293에 있어서, 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-295. 실시형태 V-293에 있어서, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-296. 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한, 선행하는 실시형태 중 어느 하나의 XDP 입자, 또는 XDP 시스템.
본 상세한 설명은 다수의 예시적인 구성, 방법, 매개변수 등을 제시한다. 그러나, 그러한 상세한 설명은 본 개시내용의 범주를 제한하기 위한 것이 아니라 예시적인 실시형태의 상세한 설명으로서 제공된다는 것을 인식해야 한다. 상기에서 기술된 본 주제의 실시형태는 단독으로 또는 하나 이상의 다른 양태 또는 실시형태와 조합하여 유익할 수 있다. 전술한 상세한 설명을 제한하지 않고, 개시내용의 특정한 비-제한적 실시형태가 하기에 제공된다. 본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 개별적으로 번호가 매겨진 실시형태 각각은 개별적으로 번호가 매겨진 이전 또는 다음의 실시형태 중 임의의 것과 함께 사용되거나 조합될 수 있다. 이는 이러한 모든 실시형태의 조합에 대한 지원을 제공하기 위한 것이고 하기에 명시적으로 제공된 실시형태의 조합으로 제한되지 않는다.
실시예
실시예 1: CasX 작제물의 생성, 발현 및 정제
1. 성장과 발현
플랑크토마이세테스(서열번호: 2의 아미노산 서열을 갖고 하기 표 6의 서열에 의해 인코딩됨)로부터 유래된 CasX Stx2(본 명세서에서 CasX2로도 지칭됨)에 대한 발현 작제물은 대장균에 최적화된 코돈인 유전자 단편(Twist Biosciences)으로부터 구축되었다. 어셈블리된 작제물은 TEV-절단가능한 C-말단의, TwinStrep 태그를 함유하고 암피실린 내성 유전자를 함유하는 pBR322-유도체 플라스미드 백본 내로 클로닝되었다. 발현 작제물을 화학적으로 유능한 BL21*(DE3) 대장균 내로 형질전환시키고, 출발 배양물을 UltraYield Flasks(Thomson Instrument Company)에서 37℃, 200RPM에서 카르베니실린이 보충된 LB 브로쓰에서 밤새 성장시켰다. 다음 날, 이 배양물을 사용하여 발현 배양물을 1:100 비율(출발 배양물:발현 배양물)로 접종했다. 발현 배양물은 카르베니실린이 보충된 Terrific 브로쓰(Novagen)였고 37℃, 200RPM에서 UltraYield 플라스크에서 성장했다. 배양물이 2의 OD에 도달하면 16℃로 냉각하고 1M 스톡으로부터, IPTG(이소프로필 β-D-1-티오갈락토피라노사이드)를 1mM의 최종 농도로 첨가했다. 배양물을 16℃, 200RPM에서 20시간 동안 유도한 후 4℃, 4000xg에서 15분 동안 원심분리에 의해 수확했다. 세포 페이스트의 무게를 측정하고 용리 완충액(50mM HEPES-NaOH, 250mM NaCl, 5mM MgCl2, 1mM TCEP, 1mM 벤자미딘-HCL, 1mM PMSF, 0.5% CHAPS, 10% 글리세롤, pH 8)에서 세포 페이스트의 그램당 용리 완충액 5mL의 비율로 재현탁했다. 재현탁되면 샘플을 정제할 때까지 -80℃에서 동결했다.
[표 6]: CasX Stx2 작제물의 DNA 서열
Figure pct00070
2. 정제
동결된 샘플을 자기 교반과 함께 4℃에서 밤새 해동하였다. 생성된 용리액의 점도는 초음파처리에 의해 감소되었고 용리는 Emulsiflex C3(Avestin)을 사용하여 17k PSI에서 3회 통과의 균질화에 의해 완료되었다. 용리액을 50,000x g, 4℃에서 30분 동안 원심분리에 의해 정화하고 상등액을 수집했다. 정화된 상등액을 중력 흐름에 의해 Heparin 6 Fast Flow 컬럼(GE Life Sciences)에 적용했다. 컬럼을 5 CV의 헤파린 완충액 A(50mM HEPES-NaOH, 250mM NaCl, 5mM MgCl2, 1mM TCEP, 10% 글리세롤, pH 8)로 세정한 다음 5 CV의 헤파린 완충액 B(500mM로 조정된 NaCl 농도를 갖는 완충액 A)로 세정하였다. 단백질을 5 CV의 헤파린 완충액 C(1M로 조정된 NaCl 농도를 갖는 완충액 A)로 용출하고, 분획으로 수집하였다. 분획을 브래드포드 검정에 의해 단백질에 대해 검정하고 단백질-함유 분획을 풀링했다. 풀링된 헤파린 용출액을 중력 흐름에 의해 Strep-Tactin XT Superflow 컬럼(IBA Life Sciences)에 적용했다. 컬럼을 5 CV의 Strep 완충액(50mM HEPES-NaOH, 500mM NaCl, 5mM MgCl2, 1mM TCEP, 10% 글리세롤, pH 8)으로 세정했다. 단백질을 50mM D-비오틴이 첨가된 5 CV의 Strep 완충액을 사용하여 컬럼으로부터 용출하고 분획으로 수집했다. CasX-함유 분획을 풀링하고 30kDa 컷-오프 스핀 농축기를 사용하여 4℃에서 농축하고 슈퍼덱스 200pg 컬럼(GE Life Sciences) 상에서 크기 배제 크로마토그래피로 정제했다. 컬럼은 AKTA Pure FPLC 시스템(GE Life Sciences)에 의해 작동되는 SEC 완충액(25mM 인산나트륨, 300mM NaCl, 1mM TCEP, 10% 글리세롤, pH 7.25)으로 평형화되었다. 적절한 분자량에서 용출된 CasX-함유 분획을 풀링하고, 30kDa 컷-오프 스핀 농축기를 사용하여 4℃에서 농축하고, 분취하고 액체 질소에서 급속-동결한 후 -80℃에 보관했다.
3. 결과
정제 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분해하고 도 1 및 도 3에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화하였다. 도 1에서, 왼쪽에서 오른쪽으로 레인은 분자량 표준, 펠렛: 세포 용리에 이어서 불용성 부분, 용리액: 세포 용리에 이어서 가용성 부분, 관류: 헤파린 컬럼에 결합하지 않은 단백질, 세정: 세정 완충액에서 컬럼으로부터 용출된 단백질, 용출: 용출 완충액으로 헤파린 컬럼에서 용출된 단백질, 관류: StrepTactinXT 컬럼에 결합하지 않은 단백질, 용출: 용출 완충액으로 StrepTactin XT 컬럼에서 용출된 단백질, 주입: s200 겔 여과 컬럼 상으로 주입된 농축된 단백질, 동결: 농축 및 동결된 s200 용리액으로부터 풀링된 분획. 도 3에서, 오른쪽에서 왼쪽으로 레인은 주입(겔 여과 컬럼 상에 주입된 단백질의 샘플) 분자량 마커이고, 레인 3-9는 표시된 용출 부피로부터의 샘플이다. 겔 여과로부터의 결과를 도 2에 도시되어 있다. 68.36mL 피크는 CasX의 겉보기 분자량에 해당하고 대부분의 CasX 단백질을 함유한다. 평균 수율은 콜로이드성 쿠마시 염색에 의해 평가된 바와 같이 75% 순도를 갖는 배양물의 리터당 정제된 CasX 단백질 0.75mg이었다.
실시예 2: CasX 작제물 CasX 119, 438 및 457
CasX 119, 438 및 457 작제물(표 7의 서열)을 생성하기 위해, 코돈-최적화된 CasX 37 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 포유동물 발현 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. CasX 119를 구축하기 위해, CasX 37 작제물 DNA를 각각 프라이머 oIC539 및 oIC88 뿐만 아니라 oIC87 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 사용한 2가지 반응에서 PCR 증폭시켰다(도 5 참조). CasX 457을 구축하기 위해, CasX 365 작제물 DNA를 각각 프라이머 oIC539 및 oIC212, oIC211 및 oIC376, oIC375 및 oIC551, 및 oIC550 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 사용하여 4가지 반응에서 PCR 증폭시켰다. CasX 438을 구축하기 위해, CasX 119 작제물 DNA를 각각 프라이머 oIC539 및 oIC689, oIC688 및 oIC376, oIC375 및 oIC551, 및 oIC550 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 4가지 반응에서 PCR 증폭시켰다. 그런 다음 생성된 PCR 증폭 생성물을 제조업체의 프로토콜에 따라 Zymoclean DNA 클린 및 농축기(Zymo Research Cat# 4014)를 사용하여 정제했다. pStX 백본을 플라스미드 pStx34 내 두 부위 사이에 있는 DNA의 2931 염기쌍 단편을 제거하기 위해 XbaI 및 SpeI를 사용하여 단리했다. 단리된 백본 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit(Zymo Research Cat#D4002)를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제되었다. 그런 다음 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 3개의 단편을 함께 이어맞추었다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격이거나 또는 전기-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트(Qiagen Cat# 27104)를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. pStX34는 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된 NEB Turbo Competent 대장균(NEB Cat #C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. SaCas9 및 SpyCas9 대조군 플라스미드는 각각의 단백질 및 가이드에 대해 교환된 pStX의 단백질 및 가이드 영역을 사용하여 상기에서 기술된 pStX 플라스미드와 유사하게 제조되었다. SaCas9 및 SpyCas9에 대한 표적화 서열은 문헌에서 얻거나 확립된 방법에 따라 합리적으로 설계되었다. CasX 119, 438 및 457 단백질의 발현 및 회수는 실시예 1의 일반적인 방법론을 사용하여 수행되었다(그러나 DNA 서열은 대장균에서 발현을 위해 최적화된 코돈이었다).
CasX 변이체 119: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 119에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 6 및 도 8에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화했다. 겔 여과로부터의 결과를 도 7에 나타내었다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 95% 순도에서 배양 리터당 정제된 CasX 단백질 11.7mg이었다.
CasX 변이체 438: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 438에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 9 및 도 11에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화했다. 겔 여과로부터의 결과를 도 10에 나타내었다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 97.5% 순도에서 배양 리터당 정제된 CasX 단백질 13.1mg이었다.
CasX 변이체 457: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 457에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 12 및 도 14에 도시된 바와 같이 콜로이드성 쿠마시 염색 및 도 13에 도시된 바와 같이 겔 여과에 의해 가시화했다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 91.6% 순도에서 배양 리터당 정제된 CasX 단백질 9.76mg이었다.
전반적으로, 결과는 CasX 변이체가 실험적 검정 및 평가에 충분한 높은 수준의 순도로 생산 및 회수될 수 있음을 뒷받침한다.
[표 7]: CasX 119, 438 및 457의 서열
Figure pct00071
실시예 3: CasX 작제물 488, 491, 515 및 527
CasX 488 작제물(표 8에서의 서열)을 생성하기 위해, 코돈-최적화된 CasX 119 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환, L379R 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 대상 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. CasX 491 작제물(표 8에서의 서열)을 생성하기 위해, 코돈-최적화된 CasX 484 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환, L379R 치환, [P793] 결실, I658V 치환 및 F399L 치환과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 대상 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. 작제물 CasX 1(CasX 서열번호: 1)은 표준 클로닝 방법을 사용하여 대상 벡터 안으로 클로닝되었다. CasX 488을 구축하기 위해, CasX 119 작제물 DNA는 프라이머 oIC765 및 oIC762를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다(도 5 참조). CasX 491을 구축하기 위해, 코돈 최적화된 CasX 484 작제물 DNA는 프라이머 oIC765 및 oIC762를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다(도 5 참조). CasX 1 작제물은 프라이머 oIC766 및 oIC784를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다. 각 PCR 생성물은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출하여 정제되었다. 상응하는 단편은 그런 다음 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 내로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론을 제한 효소 클로닝을 사용하여 포유동물 발현 벡터 pStx34 안으로 서브클로닝했다. pStx34 백본과 pStx1에서의 CasX 488 및 491 클론은 각각 XbaI 및 BamHI로 단리되었다. 단리된 백본 및 각 삽입 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제되었다. 그런 다음 깨끗한 백본과 삽입물은 제조업체의 프로토콜에 따라 T4 리가제(New England Biolabs Cat# M0202L)를 사용하여 함께 결찰되었다. 결찰된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 515(표 8에서의 서열)를 구축하기 위해, CasX 491 작제물 DNA를 각각 프라이머 oIC539 및 oSH556 뿐만 아니라 oSH555 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 2가지 반응에서 PCR 증폭시켰다(도 5 참조). CasX 527(표 8에서의 서열)을 구축하기 위해, CasX 491 작제물 DNA를 각각 프라이머 oIC539 및 oSH584 뿐만 아니라 oSH583 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하는 2가지 반응에서 PCR 증폭시켰다. PCR 생성물은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. pStX 백본은 플라스미드 pStx56에서의 두 부위 사이에 있는 DNA의 2931 염기쌍 단편을 제거하기 위해 XbaI 및 SpeI를 사용하여 단리되었다. 단리된 백본 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx56에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. pStX34는 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다. pStX56은 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가아제와 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 적절한 항생제를 함유하는 LB-아가 플레이트 상에 도말된 NEB Turbo Competent 대장균(NEB Cat #C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. SaCas9 및 SpyCas9 대조군 플라스미드는 각각의 단백질 및 가이드에 대해 교환된 pStX의 단백질 및 가이드 영역을 사용하여 상기에서 기술된 pStX 플라스미드와 유사하게 제조되었다. SaCas9 및 SpyCas9에 대한 표적화 서열은 문헌에서 얻거나 확립된 방법에 따라 합리적으로 설계되었다. CasX 작제물의 발현 및 회수는 실시예 1의 일반적인 방법론을 사용하여 수행되었고 다음과 같이 요약된다:
CasX 변이체 488: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 98.8% 순도에서 배양 리터당 정제된 CasX 단백질 2.7mg이었다.
CasX 변이체 491: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 99.4% 순도에서 배양 리터당 정제된 CasX 단백질 12.4mg이었다.
CasX 변이체 515: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 87.2% 순도에서 배양 리터당 정제된 CasX 단백질 7.8mg이었다.
[표 8]: CasX 488, 491, 515 및 527의 서열
Figure pct00072
Figure pct00073
실시예 4: CasX 작제물 278-280, 285-288, 290, 291, 293, 300, 492 및 493의 설계 및 생성
CasX 278-280, 285-288, 290, 291, 293, 300, 492 및 493 작제물(표 9에서의 서열)을 생성하기 위해, 포유동물 발현 벡터에서 코돈-최적화된 CasX 119 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 2의 CasX Stx2 작제물에 기반됨)의 N- 및 C-말단을 조작하여 NLS 서열(표 10에서의 서열)을 결실하거나 추가한다. 작제물 278, 279 및 280은 SV40 NLS 서열만을 사용한 N-말단 및 C-말단의 조작이었다. 작제물 280은 N-말단 상에 NLS가 없었고 두 SV40 NLS 서열 사이에 삼중 프롤린 링커를 갖는 C-말단 상에 2개의 SV40 NLS'를 추가했다. 작제물 278, 279 및 280은 각각 제1 단편에 대해 프라이머 oIC527 및 oIC528, oIC730 및 oIC522, 및 oIC730 및 oIC530을 사용하고 각각 제2 단편을 생성하기 위해 oIC529 및 oIC520, oIC519 및 oIC731, 및 oIC529 및 oIC731을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제로 pStx34.119.174.NT를 증폭함에 의해 제작했다. 이들 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. 각 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 클로닝되었다. pStx34에서 어셈블리된 생성물을, 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환하고 37℃에서 인큐베이션했다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유한 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
작제물 285-288, 290, 291, 293 및 300을 생성하기 위해, 내포 PCR 방법이 클로닝을 위해 사용되었다. 사용된 백본 벡터 및 PCR 주형은 CasX 119, 가이드 174 및 비-표적화 스페이서를 갖는 작제물 pStx34 279.119.174.NT였다(서열에 대해서는 실시예 8 및 9와 그 안의 표 참조). 작제물 278은 구성 SV40NLS-CasX119를 갖는다. 작제물 279는 구성 CasX119-SV40NLS를 갖는다. 작제물 280은 구성 CasX119-SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 285는 구성 CasX119-SV40NLS-PPP 링커-SynthNLS3을 갖는다. 작제물 286은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS4를 갖는다. 작제물 287은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS5를 갖는다. 작제물 288은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS6을 갖는다. 작제물 290은 구성 CasX119-SV40NLS-PPP 링커-EGL-13 NLS를 갖는다. 작제물 291은 구성 CasX119-SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 작제물 293은 구성 CasX119-SV40NLS-PPP 링커-핵소체 RNA 헬리카제 II NLS를 갖는다. 작제물 300은 구성 CasX119-SV40NLS-PPP 링커-인플루엔자 A 단백질 NLS를 갖는다. 작제물 492는 구성 SV40NLS-CasX119-SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 493은 구성 SV40NLS-CasX119-SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 각 변이체는 3개의 PCR 세트를 가지며; 그 중 2개는 내포되어 겔 추출에 의해 정제되고, 단리된 다음 단리 및 정제된 백본 안으로 결찰되었다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열이 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 생성된 pStX 안으로 클로닝했다. 골든 게이트 생성물은, 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
작제물 492 및 493을 생성하기 위해, 작제물 280 및 291을 제조업체의 프로토콜에 따라 XbaI 및 BamHI(NEB# R0145S 및 NEB# R3136S)를 사용하여 단리하였다. 다음으로, 이들을 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제했다. 마지막으로, 이들을 제조업체의 프로토콜에 따라 T4 DNA 리가제(NEB# M0202S)를 사용하여 Zymoclean Gel DNA Recovery Kit와 XbaI 및 BamHI를 사용하여 단리되고 정제된 pStx34.119.174.NT 안으로 결찰했다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 스페이서 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 각 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 각 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 플라스미드는 실시예 1 및 2의 일반적인 방법론을 이용하여 CasX 단백질을 생산하고 회수하는 데 사용된다.
[표 9]: CasX 278-280, 285-288, 290, 291, 293, 300, 492 및 493 서열
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
[표 10]: 핵 위치화 서열 목록
Figure pct00078
실시예 5: CasX 작제물 387, 395, 485-491 및 494의 설계 및 생성
CasX 395, CasX 485, CasX 486, CasX 487을 생성하기 위해, 코돈 최적화된 CasX 119(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 2의 CasX 37 작제물에 기반됨), CasX 435, CasX 438 및 CasX 484(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 L379R 치환, A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는 실시예 2의 CasX 119 작제물에 기반됨)가 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS가 있는 CasX(pStx1)를 포함하는 4kb 병기 벡터 안으로 각각 클로닝되었다. Gibson 프라이머는 각각 pStx1에서 CasX 119, CasX 435, CasX 438 및 CasX 484 상의 이 상응하는 영역(aa 193-332)을 대체하기 위해 그 자체 벡터에서 아미노산 192-331로부터 CasX 서열번호: 1 나선형 I 도메인을 증폭하도록 설계되었다. CasX 서열번호: 1로부터 나선형 I 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC768 및 oIC784로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC765 및 oIC764로 증폭되었다. 2개의 단편이 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에 어셈블리된 생성물은, 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론이 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드(도 5 참조) 안으로 붙여넣어졌다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 스페이서 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은, 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 488, CasX 489, CasX 490 및 CasX 491(표 11에서의 서열)을 생성하기 위해, 코돈 최적화된 CasX 119) CasX 435, CasX 438 및 CasX 484(각각 실시예 2의 CasX119 작제물에 기반됨)를 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS가 있는 STX(pStx1)로 구성된 4kb 병기 벡터 안으로 각각 클로닝했다. Gibson 프라이머는 각각 pStx1에서 CasX 119, CasX 435, CasX 438, 및 CasX 484 상의 이 유사한 영역(aa 103-332)을 대체하기 위해 그 자체 벡터에서 아미노산 101-191로부터의 CasX Stx1 NTSB 도메인 및 아미노산 192-331로부터의 나선형 I 도메인을 증폭하도록 설계되었다. CasX 서열번호: 1로부터 NTSB 및 나선형 I 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC766 및 oIC784로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC762 및 oIC765로 증폭되었다. 2개의 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론은 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드(도 5 참조) 안으로 붙여넣어졌다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 스페이서 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 387 및 CasX 494(표 11에서의 서열)를 생성하기 위해, 코돈 최적화된 CasX 119 및 CasX 484를 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS를 갖는 STX(pStx1)로 구성된 4kb 병기 벡터 안으로 각각 클로닝하였다. Gibson 프라이머는 그 자체 벡터에서 아미노산 101-191로부터 CasX Stx1 NTSB 도메인을 증폭하여 각각 pStx1에서의 CasX 119 및 CasX 484 상의 이 유사한 영역(aa 103-192)을 대체하도록 설계되었다. CasX Stx1로부터의 NTSB 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC766 및 oIC767로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC763 및 oIC762로 증폭되었다. 2개의 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론이 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드 안으로 붙여넣어졌다(도 5 참조). 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 생성된 작제물의 서열은 표 11에 나열되어 있다.
[표 11]: CasX 395 및 485-491의 서열
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
실시예 6: RNA 가이드의 생성
RNA 단일 가이드 및 스페이서의 생성을 위해, 시험관내 전사를 위한 주형을 각 백본에 대한 주형 올리고 및 T7 프로모터와 스페이서 서열을 갖는 증폭 프라이머로, 권장 프로토콜에 따라 Q5 폴리머라제(NEB M0491)로 PCR을 수행함에 의해 생성했다. T7 프로모터, 가이드 및 가이드에 대한 스페이서 및 스페이서에 대한 DNA 프라이머 서열은 하기 표 12에 제시되어 있다. 각 스캐폴드에 대해 "백본 fwd" 및 "백본 rev"로 표지된 주형 올리고는 각각 20nM의 최종 농도로 포함되었고 증폭 프라이머(T7 프로모터 및 고유한 스페이서 프라이머)는 각각 1μM의 최종 농도로 포함되었다. sg2, sg32, sg64 및 sg174 가이드는 각각 서열번호: 5, 600, 602 및 734에 해당하지만 단, sg2, sg32 및 sg64는 (표 2에 대해 표 12에서의 서열을 비교하여) 전사 효율을 증가시키기 위해 추가 5' G로 변형되었다는 제외가 있다. 7.37 스페이서는 베타2-마이크로글로불린(B2M)을 표적화한다. PCR에 이어서 주형을 세정하고 페놀-클로로포름-이소아밀 알코올 추출 후 에탄올 침전에 의해 단리했다.
시험관내 전사는 50mM Tris pH 8.0, 30mM MgCl2, 0.01% Triton X-100, 2mM 스페르미딘, 20mM DTT, 5mM NTP, 0.5μM 주형 및 100μg/mL T7 RNA 폴리머라제를 함유하는 완충액에서 수행되었다. 반응물을 37℃에서 밤새 인큐베이션하였다. 20 유닛의 DNase I(Promega #M6101))을 전사 부피 1mL당 첨가하고 1시간 동안 인큐베이션했다. RNA 생성물을 변성 PAGE를 통해 정제하고, 에탄올 침전시키고, 1X 인산염 완충 식염수에 재현탁시켰다. sgRNA를 폴딩하기 위해 샘플을 70℃로 5분 동안 가열한 다음 실온으로 냉각했다. 반응물을 1mM 최종 MgCl2 농도로 보충하고, 50℃로 5분 동안 가열한 다음, 실온으로 냉각시켰다. 최종 RNA 가이드 생성물은 -80℃에서 보관되었다.
[표 12]: 가이드 RNA의 생성을 위한 서열
Figure pct00083
실시예 7: 가이드 RNA에 대한 결합 친화도 평가
정제된 야생형 및 개선된 CasX는 비-특이적 결합 및 응집을 방지하기 위해 염화마그네슘 뿐만 아니라 헤파린을 함유하는 저염 완충액에서 3' Cy7.5 모이어티를 함유하는 합성 단일-가이드 RNA와 함께 인큐베이션될 것이다. sgRNA는 10pM의 농도로 유지되는 반면, 단백질은 별도의 결합 반응에서 1pM에서 100μM로 적정될 것이다. 반응이 평형을 이루도록 한 후, 샘플은 각각 단백질과 핵산을 결합하는 니트로셀룰로오스 멤브레인 및 양으로 하전된 나일론 멤브레인을 사용한 진공 매니폴드 필터-결합 검정을 통해 실행될 것이다. 멤브레인은 가이드 RNA를 식별하기 위해 이미지화되고 결합된 RNA 대 결합되지 않은 RNA의 분율은 단백질-sgRNA 복합체의 해리 상수를 계산하기 위해 각 단백질 농도에 대한 니트로셀룰로오스 대 나일론 멤브레인 상의 형광의 양에 의해 결정될 것이다. 실험은 또한 이들 돌연변이가 야생형 및 돌연변이체 단백질에 대한 가이드의 친화도에 영향을 미치는지 여부를 결정하기 위해 sgRNA의 개선된 변이체로 수행될 것이다. 본 발명자들은 또한 전기이동성 전이 검정을 수행하여 필터-결합 검정과 질적으로 비교하고 응집보다는 가용성 결합이 단백질-RNA 회합에 대한 주요 기여자임을 확인할 것이다.
실시예 8: 표적 DNA에 대한 결합 친화도 평가
정제된 야생형 및 개선된 CasX는 표적 핵산에 상보성인 표적화 서열을 담지하는 단일-가이드 RNA와 복합체화될 것이다. RNP 복합체는 비-특이적 결합 및 응집을 방지하기 위해 PAM을 함유하는 이중-가닥 표적 DNA 및 염화마그네슘 뿐만 아니라 헤파린을 함유하는 저염 완충액에서 표적 가닥 상에 5' Cy7.5 라벨이 있는 적절한 표적 핵산 서열과 함께 인큐베이션될 것이다. 표적 DNA는 1nM의 농도로 유지되는 반면, RNP는 별도의 결합 반응에서 1pM에서 100μM로 적정될 것이다. 반응이 평형을 이루도록 한 후, 샘플은 결합된 표적 DNA와 결합되지 않은 표적 DNA를 분리하기 위해 천연 5% 폴리아크릴아미드 겔 상에서 실행될 것이다. 겔은 표적 DNA의 이동성 전이를 식별하기 위해 이미지화되고, 결합된 DNA 대 결합되지 않은 DNA의 분율은 RNP-표적 DNA 삼원 복합체의 해리 상수를 결정하기 위해 각 단백질 농도에 대해 계산될 것이다.
실시예 9: CasX:gNA 시험관내 절단 검정
1. 야생형 참조 CasX와 비교하여 단백질 변이체에 대한 절단-적격 분획 결정
참조 CasX와 비교하여 활성 RNP를 형성하는 CasX 변이체의 능력은 시험관내 절단 검정을 사용하여 결정되었다. 절단 검정을 위한 베타-2 마이크로글로불린(B2M) 7.37 표적은 다음과 같이 생성되었다. 서열 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(비-표적 가닥, NTS(서열번호: 415)) 및 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(표적 가닥, TS (서열번호: 416))를 갖는 DNA 올리고가 5' 형광성 라벨(각각 LI-COR IRDye 700 및 800)과 함께 구입되었다. dsDNA 표적은 1x 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 1:1 비율로 올리고를 혼합하고 95℃로 10분 동안 가열하고, 용액을 실온으로 냉각되도록 함에 의해 형성되었다.
CasX RNP는 사용할 준비가 될 때까지 얼음으로 옮기기 전에 10분 동안 37℃에서 1× 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 달리 명시되지 않는 한 표시된 가이드의 1.5-배 과잉으로 1μM의 최종 농도에서 표시된 CasX 및 가이드(그래프 참조)로 재구성했다. 7.37 표적에 상보적인 스페이서를 갖는 sgRNA와 함께 7.37 표적이 사용되었다.
절단 반응은 100nM의 최종 RNP 농도 및 100nM의 최종 목표 농도로 준비되었다. 반응은 37℃에서 수행되었고 7.37 표적 DNA의 첨가에 의해 개시되었다. 5, 10, 30, 60 및 120분에 분취량을 취하고 95% 포름아미드, 20mM EDTA를 첨가하여 켄칭했다. 샘플을 95℃에서 10분 동안 가열하여 변성시키고 10% 우레아-PAGE 겔 상에서 수행했다. 겔은 LI-COR Odyssey CLx로 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나 Cytiva Typhoon으로 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화했다. 결과 데이터는 Prism을 사용하여 플롯팅되고 분석되었다. 본 발명자들은 CasX가 검정된 조건 하에서 본질적으로 단일-전환 효소로 작용한다고 가정했는데, 이는 화학양론적 양 이하의 효소가 연장된 시간-규모 하에서도 화학양론적 양보다 많은 양의 표적을 절단하지 못하고 대신에 존재하는 효소의 양에 따라 확장하는 정체기에 접근한다는 관찰에 의해 나타난 바와 같다. 따라서, 등몰량의 RNP에 의해 긴 시간-규모에 걸쳐 절단된 표적의 분율은 RNP의 어느 분율이 적절하게 형성되고 절단에 대해 활성인지를 나타낸다. 절단 반응은 이 농도 체제 하에서 단상에서 분명히 벗어나기 때문에 절단 흔적은 2상 속도 모델에 적합했고 3개의 독립적인 복제물 각각에 대해 정체기를 결정했다. 활성 분율을 결정하기 위해 평균 및 표준 편차를 계산했다(표 13). 그래프는 도 15에 도시되어 있다.
겉보기 활성(적격) 분율은 CasX2 + 가이드 174 + 7.37 스페이서, CasX119 + 가이드 174 + 7.37 스페이서, CasX457 + 가이드 174 +7.37 스페이서, CasX488 + 가이드 174 + 7.37 스페이서, 및 CasX491 + 가이드 174 + 7.37 스페이서에 대해 형성된 RNP에 대해 결정되었다. 결정된 활성 분율은 표 13에 나타나 있다. 모든 CasX 변이체는 야생형 CasX2보다 활성 분율이 더 높았으며, 이는 조작된 CasX 변이체가 야생형 CasX와 비교하여 시험된 조건 하에서 동일한 가이드를 사용하여 유의하게 더 활성이고 안정적인 RNP를 형성함을 나타낸다. 이것은 sgRNA에 대한 증가된 친화도, sgRNA의 존재에서 증가된 안정성 또는 용해도, 또는 조작된 CasX:sgRNA 복합체의 절단-적격인 형태의 더 큰 안정성 때문일 수 있다. RNP의 용해도에서의 증가는 CasX2와 비교하여 CasX457, CasX488 또는 CasX491이 sgRNA에 추가될 때 형성된 관찰된 침전물의 현저한 감소에 의해 표시되었다.
2. 시험관내 절단 검정 - 야생형 참조 CasX와 비교하여 CasX 변이체에 대한 k절단 결정
절단-적격인 분율은 또한, 도 16 및 표 13에 나타난 바와 같이, CasX2.2.7.37, CasX2.32.7.37, CasX2.64.7.37 및 CasX2.174.7.37에 대해 동일한 프로토콜을 사용하여 16 ± 3%, 13 ± 3%, 5 ± 2%, 및 22 ± 5%인 것으로 결정되었다.
가이드의 제2 세트는 RNP 형성에 대한 가이드의 기여를 더 잘 단리하기 위해 다른 조건 하에서 시험되었다. 7.37 스페이서를 갖는 174, 175, 185, 186, 196, 214 및 215 가이드를 이전과 같이 과잉 가이드보다는, 가이드의 경우 1μM 및 단백질의 경우 1.5μM의 최종 농도로 CasX491과 혼합했다. 결과는 도 17 및 표 13에 나타나 있다. 이들 가이드 중 다수는 174보다 추가 개선을 나타내어, 185 및 196은 이들 가이드-제한 조건 하에서 174에 대한 80 ± 9%와 비교하여 각각 91 ± 4% 및 91 ± 1% 적격인 분율을 달성했다.
데이터는 CasX 변이체 및 sgRNA 변이체 둘 모두가 야생형 CasX 및 야생형 sgRNA와 비교하여 가이드 RNA와 함께 더 높은 정도의 활성 RNP를 형성할 수 있음을 나타낸다.
야생형 참고 CasX와 비교한 CasX 변이체 119, 457, 488 및 491의 겉보기 절단 속도는 표적 7.37의 절단에 대한 시험관내 형광 검정을 사용하여 결정되었다.
CasX RNP는 사용할 준비가 될 때까지 얼음으로 옮기기 전에 37℃에서 10분 동안 1× 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 표시된 가이드의 1.5-배 과량으로 1μM의 최종 농도에서 표시된 CasX(도 18 참조)로 재구성되었다. 절단 반응은 200nM의 최종 RNP 농도 및 10nM의 최종 표적 농도로 설정되었다. 달리 언급되고 표적 DNA의 첨가에 의해 개시되는 경우를 제외하고 반응을 37℃에서 수행되었다. 분취량을 0.25, 0.5, 1, 2, 5 및 10분에 취하고 95% 포름아미드, 20mM EDTA를 첨가하여 켄칭했다. 샘플을 95℃에서 10분 동안 가열함에 의해 변성시키고 10% 우레아-PAGE 겔 상에서 수행했다. 겔을 LI-COR Odyssey CLx로 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나 Cytiva Typhoon으로 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화했다. 얻어진 데이터를 플롯팅하고 Prism을 사용하여 분석하였고, 각 CasX:sgRNA 조합 복제물에 대해 비-표적 가닥 절단(k절단)의 명백한 1차 속도 상수를 개별적으로 결정했다. 독립적인 적정을 갖는 3회 반복의 평균 및 표준 편차가 표 13에 제시되어 있고, 절단 흔적이 도 18에 도시되어 있다.
겉보기 절단 속도 상수는 각 검정에서 이용된 가이드 174 및 스페이서 7.37로 야생형 CasX2, 및 CasX 변이체 119, 457, 488 및 491에 대해 결정되었다(표 13 및 도 18 참조). 모든 CasX 변이체는 야생형 CasX2에 비해 절단 속도가 개선되었다. CasX457은 상기에서 결정된 바와 같이 더 높은 적격 분율을 가짐에도 불구하고 119보다 더 느리게 절단되었다. CasX488 및 CasX491은 큰 차이로 가장 높은 절단 속도를 가졌다; 표적이 제1 시점에서 거의 완전히 절단되었기 때문에, 실제 절단 속도는 이 검정의 분해능을 초과하고 보고된 k절단은 하한으로 취해야 한다.
데이터는 CasX 변이체가 더 높은 활성 수준을 가지며, k절단 속도는 야생형 CasX2에 비해 적어도 30-배 더 높게 도달한다는 것을 나타낸다.
3. 시험관내 절단 검정: 가이드 변이체와 야생형 가이드의 비교
절단 검정을 또한 가이드 변이체 32, 64, 및 174와 비교하여 야생형 참고 CasX2 및 참고 가이드 2로 수행하여 변이체가 절단을 개선했는지 여부를 결정하였다. 실험은 상기에 기술된 바와 같이 수행되었다. 생성된 RNP의 대부분이 시험된 시간에 표적의 완전한 절단에 접근하지 않았기 때문에, 본 발명자들은 1차 속도 상수가 아닌 초기 반응 속도(V0)를 결정했다. 처음 2개의 시점(15초 및 30초)은 각 CasX:sgRNA 조합 및 복제에 대한 라인으로 적정되었다. 3회 반복에 대한 기울기의 평균 및 표준 편차가 결정되었다.
검정된 조건 하에서, 가이드 2, 32, 64, 및 174를 갖는 CasX2에 대한 V0는 20.4 ± 1.4nM/분, 18.4 ± 2.4nM/분, 7.8 ± 1.8nM/분, 및 49.3 ± 1.4nM/분이었다(표 13 및 도 19 및 도 20 참조). 가이드 174는 생성된 RNP의 절단 속도에서 상당한 개선을 보인 반면(2에 비해 ~2.5-배, 도 20 참조), 가이드 32 및 64는 가이드 2와 유사하거나 더 나쁘게 수행되었다. 현저하게, 가이드 64는 가이드 2보다 낮은 절단 속도를 지원하지만 생체내에서 훨씬 더 양호하게 수행한다(데이터는 표시되지 않음). 가이드 64를 생성하기 위한 일부의 서열 변경은 삼중체 형성에 관여하는 뉴클레오티드를 희생시키면서 생체내 전사를 개선할 가능성이 있다. 가이드 64의 개선된 발현은 생체내에서 그 개선된 활성을 설명하기 쉬운 반면, 그 감소된 안정성은 시험관내에서 부적절한 폴딩으로 이어질 수 있다.
추가적 실험은 상대적인 절단 속도를 결정하기 위해 스페이서 7.37 및 CasX491을 갖는 가이드 174, 175, 185, 186, 196, 214 및 215로 수행했다. 본 발명자들의 검정으로 측정가능한 범위로 절단 동역학을 감소시키기 위해, 절단 반응을 10℃에서 인큐베이션하였다. 결과는 도 21 및 표 13에 있다. 이들 조건 하에서, 215는 174보다 빠른 절단 속도를 지원하는 유일한 가이드였다. 가이드-제한 조건 하에서 RNP의 가장 높은 활성 분율을 나타내는 196은 174와 본질적으로 동일한 동역학을 가져, 상이한 변이체가 뚜렷한 특성의 개선을 초래한다는 것을 다시 강조한다.
데이터는 검정의 조건 하에서 CasX를 갖는 대부분의 가이드 변이체의 사용은 ~2-배에서 >6-배까지의 범위인 초기 절단 속도에서의 개선으로, 야생형 가이드를 갖는 것보다 활성 수준이 더 높은 RNP를 초래한다는 것을 뒷받침한다. 표 13에서 숫자는 왼쪽에서 오른쪽으로 RNP 작제물의 CasX 변이체, sgRNA 스캐폴드 및 스페이서 서열을 나타낸다. 아래 표에서 RNP 작제물 명칭에서, CasX 단백질 변이체, 가이드 스캐폴드 및 스페이서는 왼쪽에서 오른쪽으로 표시된다.
[표 13]: 절단 및 RNP 형성 검정의 결과
Figure pct00084
*평균 및 표준편차
실시예 10: 시험관내 차등 PAM 인식 평가
sg174.7.37과 복합체화된 CasX2, CasX119, 및 CasX438을 사용하여, 본질적으로 실시예 9에 기재된 바와 같은 시험관내 절단 검정을 수행하였다. 7.37 스페이서 및 TTC, CTC, GTC 또는 ATC PAM을 갖는 형광으로 표지된 dsDNA 표적이 사용되었다(서열은 표 14에 있음). 시점은 0.25, 0.5, 1, 2, 5, 10, 30 및 60분에서 취해졌다. 겔은 Cytiva Typhoon으로 이미지화되었고 IQTL 8.2 소프트웨어를 사용하여 정량화되었다. 비-표적 가닥 절단(k절단)에 대한 겉보기 1차 속도 상수는 각 표적 상의 각 Casx:sgRNA 복합체에 대해 결정되었다. 비-TTC PAM을 갖는 표적에 대한 속도 상수를 TTC PAM 표적과 비교하여 각 PAM에 대한 상대적 선호도가 주어진 단백질 변이체에서 변경되었는지 여부를 결정했다.
모든 변종에 대해, TTC 표적이 가장 높은 절단 속도를 지원하고, ATC, 그 다음이 CTC, 마지막으로 GTC 표적이 뒤따랐다(도 22a-d, 표 15). CasX 변이체와 NTC PAM의 각 조합에 대해, 절단 속도 k절단이 표시된다. 모든 비-NTC PAM의 경우, 해당 변이체에 대한 TTC 속도와 비교한 상대 절단 속도가 괄호 안에 표시된다. 모든 비-TTC PAM은 실질적으로 감소된 절단 속도를 나타냈다(모두에 대해 >10-배). 특정 변이체에 대한 TTC PAM과 주어진 비-TTC PAM의 절단 속도 사이의 비율은 모든 변이체에 걸쳐 일반적으로 일관되게 유지되었다. CTC 표적은 TTC 표적만큼 빠르게 절단을 3.5-4.3% 지원했다; GTC 표적은 빠르게 절단을 1.0-1.4% 지원했다; 그리고 ATC 표적은 빠르게 절단을 6.5-8.3% 지원했다. TTC PAM에서 절단의 동역학이 너무 빨라 정확한 측정을 허용하지 않아, TTC와 비-TTC PAM 사이의 명백한 차이를 인위적으로 감소시키는 491의 경우는 예외이다. 측정가능한 범위 내에 속하는 GTC, CTC 및 ATC PAM에서 491의 상대적인 속도를 비교하면, 비-TTC PAM에 걸쳐 비교할 때 다른 변이체에 대한 것들에 필적할만한 비율을 초래하며, 이는 나란히 증가하는 속도와 일치한다. 전반적으로 변이체 간의 차이는 다양한 NTC PAM에 대한 상대적 선호도가 변경되었음을 시사할 만큼 충분히 실질적이지는 않다. 그러나, 변이체의 더 높은 기저 절단 속도는 ATC 또는 CTC PAM을 갖는 표적이 10분 이내에 거의 완전히 절단되도록 하고, 겉보기 k절단은 TTC PAM에서 CasX2의 k절단과 비슷하거나 더 크다(표 14). 이 증가된 절단 속도는 인간 세포에서 효과적인 게놈 편집에 필요한 임계치를 가로지를 수 있으며, 이는 이들 변이체에 대한 PAM 유연성에서의 겉보기 증가를 설명한다.
[표 14]. 시험관내 PAM 절단 검정에 사용된 DNA 기질의 서열.
Figure pct00085
*각각에 대한 PAM 서열은 굵게 표시된다. TS ― 표적 가닥. NTS ― 비-표적 가닥.
[표 15]. NTC PAM에 대한 CasX 변이체의 겉보기 절단 속도.
Figure pct00086
실시예 11: 닉킹 변이체의 동정
정제된 변형된 CasX 변이체는 고정된 표적화 서열을 담지하는 단일-가이드 RNA와 복합체화될 것이다. RNP 복합체는 100nM의 최종 농도에서 MgCl2를 함유하는 완충액에 첨가될 것이고, 표적 가닥에 5' 형광 표지 및 비-표적 가닥에 5' Cy5 표지가 10nM의 농도로 있는 이중-가닥 표적 DNA와 함께 인큐베이션될 것이다. 반응의 분취량을 고정된 시점에서 취하고 동일한 부피의 50mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭될 것이다. 샘플은 변성 폴리아크릴아미드 겔에서 수행되어 절단된 DNA 기질과 절단되지 않은 DNA 기질을 분리한다. 한 가닥이 효율적으로 절단되지만 다른 가닥은 절단되지 않는다는 것은 변이체가 단일-가닥 닉카제 활성을 갖고 있음을 나타낸다.
실시예 12: RNP 생산을 위한 CasX 변이체의 개선된 발현 및 용해도 특성 평가
야생형 및 변형된 CasX 변이체는 동등한 조건 하에서 BL21(DE3) 대장균에서 발현될 것이다. 모든 단백질은 IPTG-유도성 T7 프로모터의 제어 하에 있을 것이다. 세포는 37℃에서 TB 배지에서 OD 0.6으로 성장할 것이고, 이 시점에서 성장 온도는 16℃로 감소하고 0.5mM IPTG의 첨가에 의해 발현이 유도될 것이다. 세포는 발현 18시간 후에 수확될 것이다. 가용성 단백질 분획을 추출하고 SDS-PAGE 겔 상에서 분석할 것이다. 가용성 CasX 발현의 상대적 수준은 쿠마시 염색에 의해 동정될 것이다. 단백질은 상기 프로토콜에 따라 병렬로 정제되고 순수 단백질의 최종 수율이 비교될 것이다. 정제된 단백질의 용해도를 결정하기 위해, 작제물은 단백질이 침전되기 시작할 때까지 저장 완충액에 농축될 것이다. 침전된 단백질은 원심분리에 의해 제거되고 가용성 단백질의 최종 농도는 각 변이체에 대한 최대 용해도를 결정하기 위해 측정될 것이다. 마지막으로, CasX 변이체는 단일 가이드 RNA와 복합체화되고 침전이 시작될 때까지 농축될 것이다. 침전된 RNP는 원심분리에 의해 제거되고 가용성 RNP의 최종 농도는 가이드 RNA에 결합될 때 각 변이체의 최대 용해도를 결정하기 위해 측정될 것이다.
실시예 13: XDP 작제물, 형질감염 및 회수.
플라스미드 및 세포주
tdTomato를 표적화하는 스페이서 서열 12.7(CTGCATTCTAGTTTGTGTTTT에 의해 인코딩됨, 서열번호: 825)을 갖는 단일 가이드 RNA 174 및 CasX, CasX 119, CasX 438 또는 CasX 457 단백질의 RNP를 함유하는 CasX 전달 입자(XDP)는 도 23에 도시되고 표 16에 나열된 4개의 플라스미드(CasX가 이용되는 것에 따라 다른 플라스미드를 가짐)를 사용한 LentiX HEK293T 세포(Takara Biosciences)의 일시적인 형질감염에 의해 생성되었다. pStx43 플라스미드는 Gag 폴리단백질 서열과 이어지는 C-말단에서 융합된 CasX 단백질(pXD10은 CasX 119를 인코딩하고; pXD11은 CasX 438을 인코딩하고; pXD12는 CasX 457을 인코딩함)을 함유한다. SQNYPIVQ(서열번호: 20) HIV-1 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 Gag 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서의 스캐폴드 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림을 사용하여 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 스캐폴드 및 비-표적화 스페이서 성분을 갖는 CasX 가이드 카세트를 만들고, 편집 검정에서 대조군으로 사용했다. XDP 및 Gag-Pol(psPax2) 단백질을 위형화하기 위한 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 내에 합체된 서열은 표 16에 제시되어 있다.
[표 16]: 플라스미드 인코딩 서열
Figure pct00087
Figure pct00088
Figure pct00089
Figure pct00090
Figure pct00091
Figure pct00092
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 10cm 접시에 접종했다. 세포를 형질감염 전에 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 다음 플라스미드 양이 사용되었다: 19.8μg의 pXDP10, pXDP11, 또는 pXDP12. 5μg의 pStx42.174.12.7, 3.3μg의 psPax2, 및 1μg의 pGP2로 680μl의 Opti-MEM 배지 내. 87.5μl의 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 그 다음 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 10mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과 후 남은 대략적으로 8mL 중 1mL는 적정 및 후속 검정을 위해 4℃에 보관했다. 나머지 여과된 상등액은 세포 편집에 직접적으로 사용하거나 아래에 기술된 대로 NTE 중 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리하여 농축했다.
실시예 14: XDP의 정제
XDP 생산을 위한 다양한 실시예에 기재된 바와 같이, 생산 세포는 가습된 5% CO2 분위기에서 37℃에서 10% 소 태아 시스템이 보충된 DMEM에서 유지되었다. 세포를 형질감염 24시간 전에 15cm 플레이트에 도말하였다. 적절한 플라스미드와 함께 PEI를 사용하여 형질감염을 수행하였다. 배지를 제거하고 형질감염 24시간 후에 6.25U/mL의 벤조나아제를 함유하는 Opti-MEM으로 대체하였다. XDP-함유 상등액은 형질감염 72시간 후에 수집하고 0.45μM PES 필터를 통해 여과한 후 정제할 때까지 4℃에서 보관했다.
원심분리 프로토콜
여과된 상등액을 적당한 수의 원심분리 튜브 또는 병에 고르게 분할하고 수크로스 완충액(50mM Tris-HCL, 100mM NaCl, 10% 수크로스, pH 7.4)의 상등액 부피의 1/5을 혈청학적 피펫을 사용하여 깔았다. 샘플은 무 브레이크로 4시간 동안 스윙-버킷 로터에서 10,000xg, 4℃에서 원심분리되었다. 상등액을 조심스럽게 제거하고 원심분리 용기를 뒤집어서 펠렛을 잠시 건조시켰다. 그런 다음 펠렛을 저장 완충액(PBS + 113mM NaCl, 15% 트레할로스 이수화물, pH 8) 또는 적절한 배지에 부드러운 분쇄 및 볼텍싱에 의해 재현탁했다.
컬럼 프로토콜
여과된 상등액을 4℃에서 FPLC 기기를 사용하여 음이온 교환 크로마토그래피(AEX)로 정제하였다. AEX 컬럼을 완충액 A로 평형화하고, 상등액을 적용하고, 컬럼을 10CV의 완충액 A(100mM Tris-HCl, pH 7.5)로 세정하였다. 결합된 물질은 40 컬럼 부피에 걸쳐 0% - 100% 완충액 B(100mM Tris-HCl, 1M NaCl, pH 7.5)의 구배 용출을 사용하여 용출되었다. XDP-함유 분획을 풀링하고 완충액 C(100mM Tris-HCl, 300mM NaCl, pH 7.5)로 평형화된 CaptoCore 700 컬럼(Cytiva)을 사용하여 추가로 정제했다. 그런 다음 XDP-함유 관류를 실온에서 100kDa 컷오프 스핀 농축기를 사용하여 농축했다. 얻어진 농축 샘플을 저장 완충액 안으로 정용여과하고, 분취하고, 액체 질소에서 급속-동결한 후 -80℃에서 보관했다.
정량화
샘플을 열 수조에서 37℃에서 신속하게 해동하고, 볼텍싱하고, 0.1% Tween 20이 보충된 2xPBS에서 희석했다. 입자 역가 및 크기는 NP150 나노포어에서 qNano Gold TRPS 시스템(Izon Science)을 사용하여 평가되었다.
도 34는 원심분리 정제 공정 전반에 걸쳐 취한 샘플의 대표적인 SDS-PAGE 및 웨스턴 블롯 이미지를 나타낸다. 왼쪽에서 오른쪽으로 레인: 세포: 생산자 세포, 전: 상등액 여과-전, 후: 0.45μM 여과된 상등액, 상등액: 원심분리 후 남은 상등액, 펠렛: 재현탁된 XDP 펠렛. 총 단백질은 StainFree 기술(BioRad)로 시각화되었으며 표시된 항체로 웨스턴 블롯팅을 수행했다. 이들 도면은 XDP가 원심분리나 컬럼 크로마토그래피에 의해 포유동물 생산자 세포 상등액에서 정제되고 농축될 수 있음을 나타낸다. 도 34에서, 전체 단백질 염색은 특정 단백질이 전체 세포 용해물(세포 레인)에서 과도하게 나타나지 않는 상등액에 농축되어 있음을 나타낸다. 전, 후 및 상등액 레인은 구별할 수 없으며, 이는 벌크 단백질이 XDP 펠릿에 집중되지 않음을 나타낸다. 이것은 gag-CasX-HA, VSV-G 및 gag의 분자량과 일치하는 고유 밴드를 갖는 펠릿 레인의 구성에서 변화에 의해 추가로 나타내어 진다. 웨스턴 블롯팅은 이들 결과를 확인하여, 각 레인에 동일한 양의 단백질이 장입되었음에도 불구하고 가장 중요한 염색이 펠릿 레인에 있음을 나타낸다. 두 번째로 가장 어두운 염색은 입력 레인에서 볼 수 있으며, 이 과정에 의해 입자가 집중되어 있음을 나타낸다. 다른 레인에서 염색의 결실은 각 단계에서 단지 미미한 양의 입자만 손실된다는 것을 나타낸다.
평균적으로, 이 정제 공정은 TRPS에 의해 측정된 직경이 평균 113nm인, 밀리리터당 2.48 x 1011 입자의 농도에서 여과된 상등액의 리터당 4.13 x 1012 입자를 산출한다. 이 방식으로 정제된 입자의 평균 활성은 일단 정제되면 mL당 4.27 x 107 편집 단위(EU)였다. 이는 1.42 x 107 EU/L 배양액으로 작동하며, 이는 치료적 사용을 위한 벡터의 생산을 위한 실현가능한 수율이다.
실시예 15: XDP 작제물, 형질감염 및 회수
버전 1-24(표 17 참조)로 명명된 CasX 전달 입자(XDP)의 대안적인 구성 버전은 4개의 상이한 CasX 변이체 단백질; CasX119, CasX438, CasX 457 또는 CasX 491의 RNP를 함유하도록 설계되었으며, tdTomato(CTGCATTCTAGTTGTGGTTT에 의해 인코딩됨, 서열번호: 825)를 표적화하는 스페이서 서열 12.7을 갖는 단일 가이드 RNA 변이체 174와 복합체화되었다. XDP는 아래에 기술된 방법을 사용하여, 하나 이상의 구조적 플라스미드(Gag-Pol HIV-1 시스템의 하나 이상의 성분, 위형화 당단백질을 인코딩하는 플라스미드 및 단일 가이드 RNA를 인코딩하는 플라스미드로부터 유래됨(버전 1을 나타내는, 도 17 참조)를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적인 형질감염에 의해 생산되었다. 버전 번호별로 그룹화된 표 17에는 "디자인" 열에 표시된 성분을 함유하는 XDP의 각 버전을 생성하는 데 사용된 플라스미드 (및 그의 서열)가 나열되어 있고, 도 24는 버전에서 다양한 플라스미드의 조직화의 개략도를 나타낸다. 플라스미드는 실시예 13에 요약된 방법을 이용하여 구성되었다. 가이드 RNA를 인코딩하는 플라스미드의 경우, pStx42 플라스미드는 실시예 13에 기재된 단일-가이드 형식에서 tdTomato에 표적화된 스캐폴드 및 스페이서 성분을 갖는 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 편집 검정에서 대조군으로 사용되는 스캐폴드 및 비-표적화 스페이서 성분을 갖는 가이드 RNA 카세트를 만든다. XDP 및 Gag-Pol(psPax2) 단백질을 위형화하기 위한 VSV-G를 인코딩하는 플라스미드(pGP2)도 사용되었다(표 16에서의 대표적인 서열). 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다.
[표 17]: 플라스미드 인코딩 서열
Figure pct00093
Figure pct00094
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 10cm 접시에 접종했다. 세포를 형질감염 전에 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 680μl의 Opti-MEM 배지에서 5μg의 가이드 플라스미드 및 0.1μg의 pMD2.G와 함께 표 17의 플라스미드. 87.5μl의 1mg/ml 선형 폴리에틸렌이민(PEI, MW=40,000 Da)을 그 다음 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 10mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과 후 남은 대략적으로 8mL 중 1mL는 적정 및 후속 검정을 위해 4℃에 보관했다. 나머지 여과된 상등액은 세포 편집에 직접적으로 사용하거나 NTE 중 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리하여 농축했다.
실시예 16: XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석을 사용한 수크로스 완충액 농축액, 뿐만 아니라 Opti-MEM 음성 대조군으로부터 10x 농축액으로 표적화 XDP(tdTomato의 경우 스페이서 12.7을 가짐) 및 비-표적화 XDP(비-표적화 스페이서를 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장되었다.
결과: 편집 검정의 결과를 하기 도 25 및 표 18에 나타내었다. 도 25는 단일 실험의 결과를 나타낸다(표적화 XLP는 VSV-g를 갖는 XDP CasX119이고; Bald VLP는 GP 없는 XDP CasX119이고; 그리고 음성 대조군은 표 18에 표지된 바와 같은 완충액 대조군인 반면, 표는 dtTomato 표적 서열의 20% 편집이 CasX 119 작제물을 포함하는 XDP로 달성되었음을 보여주는 3회 실험의 평균 결과를 나타낸다.
[표 18]: 편집 검정의 결과
Figure pct00095
실시예 17: 향성 및 편집 능력을 평가하기 위해 합체된 당단백질을 갖는 XDP의 구축
렌티바이러스 및 레트로바이러스 벡터를 포함하는 바이러스 벡터는 가장 흔히 광범위한 숙주 세포 범위와 높은 벡터 입자 안정성 둘 모두를 부여하는 당단백질인; 수포성 구내염 바이러스(VSV-G)의 외피 단백질로 위형화되었다. 마우스 신경 전구 세포(tdT NPC)에서 tdTomato 편집에 특이적인 CasX의 RNP와 gNA가 합체된 XDP가 다양한 농도의 합체된 VSV-G로 생성되어 VSV-G에 의한 편집 모이어티의 향상된 전달을 통한 tdT NPC에서 편집에 대한 상응하는 효과를 결정하는 실험이 수행되었다.
도 26-28에 도시된 실험은 XDP 생산 방법(tdT에 표적화된 스페이서 서열 12.7을 갖는 CasX 119 및 단일 가이드 RNA 174의 경우) 및 적용가능한 경우 실시예 13 및 15에 자세히 설명된 시험 절차를 따른다. 서열은 표 19에 나타나 있다. 도 26a 및 26b에서의 데이터를 초래하는 실험을 위해, XDP에 합체된 다양한 농도의 위형별(VSV-G) 플라스미드의 효과는 다음과 같이 평가되었다: 1μg의 VSV-G 플라스미드는 100% VSV-G 그룹에 사용되었고, 0.3μg은 30% VSV-G 그룹에 사용되고, 0.1μg은 10% VSV-G 그룹에 사용되었고, 0.03μg은 3% VSV-G 그룹에 사용되고, 0.01μg은 1% VSV-G 그룹에 사용되고, 0.003μg은 0.3% VSV-G 그룹에 사용되었다. 생산된 XDP의 역가측정은 Takara p24 급속 역가 키트를 사용하여 수행되었다. 편집은 실시예 16에 자세히 기술된 바와 같이 tdTomato NPC 세포에서 평가되었다.
10% 및 30% VSV-G 그룹에 대한 결과는, 도 26b에 도시된 바와 같이 바이러스 역가 또는 안정성에 영향을 미치지 않으면서, 도 26a에 도시된 바와 같이 100% VSV-G 그룹과 비교하여 더 나은 편집 결과를 향한 경향이 있다.
결과에 따르면 실험 조건 하에서 100% VSV-G 그룹과 비교하여 10-30% VSV-G로 더 높은 편집은 아니더라도 동일하게 달성할 수 있으며, 이는 VSV-G가 있거나 없는 다른 인코딩된 당단백질로 XDP 입자를 위형화하는 가능성을 열어, 본 명세서에 개시된 바이러스 당단백질을 포함하는, 얻어진 XDP에 차등적 또는 고양된 세포 향성을 부여하며, 이의 예는 다음과 같이 생산 및 평가되었다는 것을 나타낸다. 실시예 13 및 15의 XDP 생산 및 편집 방법을 이용하여, 각각의 XDP 형질감염은 분자량에서 다양한 각 당단백질(들) 플라스미드의 0.262pM 및 스페이서 12.7을 사용하여 tdTomato 유전자좌를 표적화하는 3.3μg(0.467pM)의 psPax2 플라스미드, 19.8μg(3.24pM)의 pStx43.119 플라스미드, 5μg(3.13pM)의 pStx42 플라스미드(가이드 174를 가짐)를 사용하였다. 당단백질 플라스미드는 동일한 백본 pGP2를 함유하였고 그들이 발현하는 상이한 바이러스 외피 단백질을 발현함에 의해서만 변화하였다. 다음 플라스미드를 형질감염에 사용하였다: 광견병은 0.94μg의 pGP29를 사용하였고; FUG E는 0.95μg의 pGP60을 사용하였고; HSV-1은 0.28μg의 pGP14.1, 0.22μg의 pGP14.2, 0.27μg의 pGP14.3 및 0.20μg의 pGP14.4를 사용하였고; RD114는 0.96μg의 pGP8을 사용하였고; HCV는 0.97ug의 pGP23을 사용하였고; EBOV는 1.02μg의 pGP41을 사용하였고; Mokola는 1.02μg의 pGP30을 사용하였다. 규범적인 HSV-1 위형화는 이 검정에서 등몰량으로 사용된 4개의 당단백질을 필요로 한다(Polpitiya Arachchige, S., Henke, W., Kalamvoki, M. 등 Analysis of herpes simplex type 1 gB, gD, and gH/gL on production of infectious HIV-1: HSV-1 gD restricts HIV-1 by exclusion of HIV-1 Env from maturing viral particles. Retrovirology 16:9 (2019)). 당단백질 아미노산 서열은 야생형 바이러스 서열에서 유래한다. 핵산 서열은 또한 야생형 바이러스 서열에서 유래했지만 일부는 인간 세포주에서 합성 및 발현을 위해 최적화된 코돈이었다.
마우스 tdTomato NPC에서 편집 효율은 상기에서 기술된 바와 같이 생성된, VSV-G, 광견병, FUG E, HSV-1, RD114, C형 간염 바이러스(HCV) 및 에볼라 바이러스(EBOV)로부터의 당단백질을 갖는 위형화된 XDP의 초기 패널로 시험되었다. 결과를 도 27에 나타내었다. FUG E, Mokola 및 단순 포진 바이러스-1(HSV-1) 합체된 당단백질을 갖는 작제물은 NPC에서 어느 정도의 세포 진입을 달성할 것으로 예상된 반면, 광견병은 마우스 신경 전구 세포 안으로 세포 진입에 대한 판독인, 검정의 조건 하에서 편집의 관찰가능한 수준을 초래하는 VSV-G 이외의 유일한 당단백질이었다. 반대로, HCV, EBOV 및 RD114로 위형화된 XDP는 마우스 NPC에서 임의의 편집을 달성하지 못했으며, 이는 이 세포 유형에 대한 잠재적인 세포 특이성 요구사항을 나타낸다.
본 발명자들은 또한 상이한 바이러스 당단백질을 사용한 위형화가 전반적인 크기 분포에 영향을 미칠 수 있는지 여부를 평가하였고, 이는 관심있는 상이한 조직에서 생체내 편집 효율에 영향을 미칠 수 있다. 이 실험을 위해, 광견병 위형화된 XDP 10X 및 VSV-G 위형화된 XDP 1x는 6웰 형식으로 확장되고 pGP2 플라스미드 대신 pGP29를 사용하여 상기에 기술된 프로토콜을 사용하여 생성되었다. 사용된 모든 플라스미드 양과 세포는 8-배 축소되었다. VSV-G 위형화된 XDP 1X는 상기에 기술된 바와 같이 생성되었다. 그런 다음 이들 제제는 수크로스 완충액 없이 4℃에서 90분 동안 20,000 x g에서 농축되었다. LV는 다음 플라스미드 중량으로 형질감염되었다: 5.4μg의 psPax2, 1.8μg의 pGP2 및 7.2μg의 pStx34.119.174.12.7, VSV-G 위형화된 XDP 1X와 동일한 효소적 능력을 갖는 RNP의 생산 및 합체를 유도하도록 설계된 렌티바이러스 생성. 샘플은 분석을 위해 적절하게 희석되었다. 입자의 크기와 수는 Tunable Resistive Pulse Sensor(Izon Biosciences qNano Gold)를 사용하여 평가되었다. 광견병 및 VSV-G XDP 둘 모두는 75-140nm 크기의 범위에 있는 반면, 렌티바이러스(LV)는 도 28a에 도시된 바와 같이 85-160nm의 크기인 범위로 약간 더 큰 경향이 있다. 도 28b는 광견병 위형화된 XDP가 VSV-G 위형화된 XDP와 비교하여 더 작은 모드로 향한 경향이 있음을 나타낸다.
[표 19]. 당단백질에 대한 플라스미드 인코딩 서열.
Figure pct00096
실시예 18: 고양된 편집 능력을 갖는 CasX를 포함하는 RNP를 갖는 XDP의 구축 및 평가
XDP 플랫폼 내의 표적화 능력 및 특이성을 개선하는 것에 부가하여, CasX 438 및 CasX 457(CasX 119와 비교)을 갖는 개선된 RNP 변이체를 합체하는 XDP의 편집 능력을 동시적으로 개선하는 능력이 조사되었다(가이드 174 및 스페이서 12.7을 가짐). RNP 변이체는 pStx43 플라스미드 내에서 CasX 인코딩 서열을 교환하여 구성되었다. RNP 457은 19.8μg의 pStx43.119를 사용하여 형질감염되었고, RNP 438은 19.8μg의 pStx43.438을 사용하여 형질감염되었고, RNP 119는 19.8μg의 pStx43.119를 사용하여 형질감염되었다(표 20에서의 서열). 마우스 NPC에서 편집 백분율은 상기에 기술된 tdTomato 검정을 사용하여 평가되었고 판독은 Attune NxT 유세포분석기를 사용하여 수행되었다. 역가는 Takara p24 급속 역가 키트를 사용하여 평가되었다. 도 29에 도시된 결과는 CasX 119를 포함하는 RNP와 비교하여 CasX 438 및 CasX 457을 포함하는 RNP를 갖는 XDP에 의한 tdTomato NPC의 고양된 편집을 입증한다.
실시예 19: 비-필수 렌티바이러스 성분이 제거된 XDP의 구축 및 평가
바이러스 벡터 안으로 RNP 패키징을 최적화함에 의해 XDP 편집을 개선하는 능력은 Gag-CasX 작제물로부터 바이러스 게놈(Gag-Pol)과 같은 비-필수 성분을 제거함에 의해 평가되었다. 더욱이, 이들 성분의 제거는 인간에서의 사용에 대한 우려의 원인이 되어온 역전사효소(RT), 인테그라제(IN) 성분을 제거하여 이들 플랫폼이 갖는 일부 안전 문제를 완화할 수 있다. 더욱이, 패키징된 모든 Gag 분자는 그것에 부착된 CasX 분자를 가지므로 XDP 분자 내로 RNP 복합체의 증가된 패키징의 가능성을 제공한다.
XDP는 상기에 기술된 것과 동일한 접근법을 사용하여 생성되었다(즉, 8 x 106 LentiX 세포를 10cm 접시에 도말하고, 24시간 후에 세포를 DNA로 형질감염시키고, 형질감염 16시간 후에 배지를 교체하고, XDP를 형질감염-후 72시간에 수집하고 농축했다). 여기서, 본 발명자들은 Gag-CasX-PR(또는 pMRG103; 표 20에서의 서열)이라고 하는 Gag, CasX 및 프로테아제 성분을 갖는 새로운 플라스미드를 도입했다. 이 플라스미드는 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위에 의해 연결된 CasX 분자가 이어지는 gag 폴리단백질을 함유한다. CasX 분자 다음에는 HA 태그 및 HIV-1로부터 Pol 단백질의 성분에 연결된 또 다른 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위가 이어진다. 이 성분은 HIV-1 프로테아제(PR)를 함유하고 HIV-1 역전사효소(RT), p15 및 인테그라제(INT) 성분을 결한다. 세포막에서 XDP가 발아되면, 프로테아제는 천연 Gag-Pol 복합체에서 발견되는 프로테아제와 동일하게 기능한다; 이것은 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위를 이량체화하고 그의 절단을 촉진하여 Gag 및 PR로부터 CasX를 유리한다. 이 새로운 작제물을 갖는 XDP를 생성하기 위해, 다음 플라스미드 양이 사용되었다: pGP2 0.3μg, 스페이서 12.7을 갖는 pStx42(가이드 174) 5μg, 및 pStx43.119(CasX 119) 19.8μg. 추가 작제물은 다음 플라스미드 양을 사용하였다; 100% Gag-Pol은 3.3μg의 psPax2를 사용하였고; 50% Gag-Pol + 50% Gag-CasX 작제물은 1.65μg의 psPax2 및 1.48μg의 Gag-CasX-PR을 사용하였고; 30% Gag-Pol + 70% Gag-CasX 작제물은 0.99μg의 psPax2 및 1.47μg의 Gag-CasX-PR을 사용하였고; 15% Gag-Pol + 85% Gag-CasX 작제물은 0.50μg의 psPax2 및 2.51μg의 Gag-CasX-PR을 사용하였고; 100% Gag-CasX 작제물은 3.00μg의 Gag-CasX-PR을 사용하였다. 서열은 표 20에 제공되어 있다.
tdTomato NPC의 편집은 상기 기재된 바와 같이 평가되었고, XDP 제제의 역가는 Takara p24 급속 역가 키트를 사용하여 평가되었다. 도 30에 도시된 결과는 Gag-CasX-PR로 생성되고 Gag-Pol을 포함하지 않은 XDP는 100% Gag-Pol을 갖는 XDP가 있는 ~108 입자와 비교하여 ~106 입자에서 동일한 양의 편집을 달성할 수 있었음을 입증했다. 다른 작제물은 입자의 역가에 비례한 편집을 보였다. 생성된 다양한 작제물에 대한 역가 데이터는 도 31에 도시되어 있다. 본 발명자들은 도 32에 묘사된 바와 같이 상이한 XDP 작제물에 대한 가이드 RNA 정량화에 의해 나타난 바와 같이, 편집 효율에서 관찰된 이 향상이 XDP당 RNP 분자의 고양된 패키징에 기인한다고 믿는다.
[표 20]: 플라스미드 인코딩 서열
Figure pct00097
실시예 20: 인간 세포를 표적화하는 XDP의 구축 및 평가
tdTomato 마우스 신경 전구 세포 모델은 XDP의 효능을 평가하기 위한 강력한 도구이다. 그러나, XDP의 의도된 임상적 적용을 고려할 때 이들 입자의 효능은 쉽게 접근가능하고 정량화가능하고 치료적으로 관련된 세포주를 사용하여 인간 세포에서 평가되어야 한다. MHC I 베타 2 마이크로글로불린(B2M)에 대한 인간 HLA 유전자좌가 이들 기준에 적합하기 때문에, XDP는 상기 실시예 13 및 15에 기술된 방법론을 사용하여 생성되었으며, RNP는 Jurkat 세포인, 인간 T-세포주에서 평가하기 위해 B2M을 표적화하는 스페이서 서열을 갖는 CasX 119 및 gNA 174를 포함한다. 스페이서 7.9(GTGTAGTACAGAGATAGAA, 서열번호: 824) 및 7.37(GGCCGAGATGTCTCGCTCCG, 서열번호: 826)은 인간 B2M 유전자좌를 표적화하고 마우스에서 인공 tdTomato 유전자좌를 표적화하는 스페이서 12.7(CTGCATTCTAGTTGTGGTTT, 서열번호: 825)은 비-표적화 스페이서로 사용되었다. Jurkat 세포는 10% FBS, 피루브산나트륨 및 GlutaMAX가 보충된 RPMI 배지에서 96웰 플레이트에 접종되었다. Opti-MEM에 재현탁된 XDP를 Jurkat 세포에 넣기 전에 RPMI 배지에서 하프-로그 연속 희석액으로 희석하고 1000 x g에서 15분 동안 스핀 감염했다. 세포를 분석하기 전에 37℃에서 120시간 동안 인큐베이션하였다. HLA를 염색하기 위해 본 발명자들은 DAPI를 사용하여 죽은 세포를 표시하고 PE-Cy7 마우스 항-인간 HLA-ABC 염색 키트(BD Pharmingen)를 사용하여 주요 조직적합성 복합체, 클래스 I을 염색했다. 세포 표면에서 이 복합체의 발현은 B2M 녹아웃에 의해 차단되었다.
결과:
도 33에 도시된 결과는 스페이서 7.9, 스페이서 7.37, 또는 비-표적화 스페이서를 갖는 CasX 분자를 함유하는 XDP로 처리된 후 Jurkat 세포에서 상대적인 HLA 음성(편집된) 모집단을 묘사한다. 결과는 실험 조건 하에서 스페이서 7.9를 갖는 XDP가 Jurkat 세포의 ~10%에서 B2M을 녹아웃할 수 있음을 나타낸다.
실시예 21: 다양한 구성에서 HIV-1 Gag의 대안적 구조를 갖는 HIV-1 XDP의 생성 및 효능 평가.
이들 실험의 목적은 시험관내 또는 생체내 전달에 의해; 진핵 세포의 편집에서의 그 유용성을 입증하기 위해 RNP로서 CasX 및 가이드 RNA를 포함하는 XDP 작제물의 다양한 구성을 만드는 것이었다. RNP 전달을 위해 특별히 설계된 가장 효율적이고 최소의 HIV-1 캡시드를 생성하기 위해, 본 발명자들은 tdTomato에 가이드 RNA 174 및 스페이서 12.7과 CasX 491을 갖는 35가지 다른 버전의 HIV-1 기반 XDP를 만들어 1) HIV의 성분이 표적 핵산을 편집할 수 있는 세포에 RNP의 성공적인 전달을 위해 필요한지 필요하지 않은지를 판단하고; 2) XDP의 다중 구성이 RNP를 세포에 성공적으로 전달하고 표적 핵산을 편집할 수 있음을 입증한다. 방법
XDP의 생성을 위한 방법
버전 1, 4, 5, 7-27, 32-40, 및 122-124, 126 및 128(도 36-68 참조)로 지칭되는 XDP의 대안적인 구성 버전은 tdTomato(CTGCATTCTAGTTTGGTTT에 의해 인코딩됨, 서열번호: 825)에 표적화된 스페이서 서열 12.7을 갖는 단일 가이드 RNA 변이체와 복합된 CasX 491의 RNP를 함유하도록 설계되었다. 아래 섹션에 기술된 방법을 사용하여, XDP 버전은 gag-pol HIV-1 시스템의 성분을 인코딩하는 하나 이상의 구조적 플라스미드, 위형화 당단백질을 인코딩하는 플라스미드 및 단일 가이드 RNA를 인코딩하는 플라스미드(각 버전, 이용된 플라스미드 및 플라스미드가 인코딩하는 성분의 개략도에 대해서는 도 36-68 참조))로 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. 버전 번호별로 그룹화된 표 21은 표에 표시된 성분 및 도면의 상응하는 버전을 함유하는 XDP의 각 버전을 생성하는 데 사용된 플라스미드 및 그 서열을 나열한다. 가이드 RNA를 인코딩하는 플라스미드의 경우, pStx42 플라스미드는 단일-가이드 형식(p42.174.12.7)에서 tdTomato에 표적화된 스캐폴드 및 스페이서 성분을 갖는 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 스캐폴드 및 비-표적화 스페이서 성분(Stx42.174.NT)를 갖는 가이드 RNA 카세트를 만들고, 편집 검정에서 대조군으로 사용했다. XDP를 위형화하기 위한 VSV-G(pGP2)를 인코딩하는 플라스미드도 사용되었다(표 22). 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다.
구조적 플라스미드 클로닝
pXDP3, pXDP17, pXDP23-32, pXDP98-100, pXDP102 및 pXDP103을 생성하기 위해, pXDP1(UC Berkeley)을 EcoRI를 사용하여 단리하여 gag-pol 서열을 제거하였다. 제조업체의 프로토콜에 따라 15-20개 염기쌍 중첩을 갖는 In Fusion 프라이머와 Kapa HiFi DNA 폴리머라제를 사용하여 CasX 및 HIV-1 성분을 함유하는 단편 1 내지 3개를 증폭했다. 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제했다. 이들 단편은 제조업체의 프로토콜에 따라 Takara로부터의 In-Fusion HD Cloning Kit(Cat# 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 암피실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 인코딩 서열은 표 23에 제시되어 있다. 표의 첫 번째 열은 버전 번호와 포함된 CasX 분자를 기술한다. 두 번째는 HIV 성분과 CasX 분자의 구성이다. 이들 디자인 플라스미드에 대한 플라스미드 번호는 세 번째 열에 있다. 네 번째 열은 해당되는 경우 HIV-1 gag, HIV-1 pol 및 CasX 분자에 대한 단지 인코딩 서열에 대한 SEQ IDS를 함유한다.
가이드 플라스미드 클로닝
가이드 RNA 174 및 비-표적화 스페이서를 인코딩하는 p42.174.NT(NT 서열 CGAGACGTAATTACGTCTCG, 서열번호: 827) 플라스미드 및 tdTomato를 표적화하는 p42.174.12.7을 표준 클로닝 방법을 사용하여 클로닝하였다. 포유동물 발현 백본은 cPPT, 암피실린 내성 및 colEI 복제 부위를 함유했고 U6 프로모터 및 가이드 RNA 스캐폴드 카세트를 수용하기 위해 적절한 중첩을 갖는 프라이머를 사용하여 증폭되었다. 이들 단편은 In-Fusion 클로닝에 적합한 프라이머 및 제조업체의 프로토콜에 따라 Kapa HiFi DNA 폴리머라제를 사용하여 증폭되었다. 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 이들 단편은 제조업체 프로토콜에 따라 Takara로부터의 In-Fusion® HD Cloning Kit(Cat# 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 암피실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
p42.174.NT 안으로 tdTomato 스페이서 12.7 클로닝
tdTomato 표적화 스페이서 12.7에 대한 표적화 스페이서 서열 DNA는 표적화 서열(CTGCATTCTAGTTGTGGTTT, 서열번호 825) 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로 주문되었다. 이들 두 올리고는 함께 어닐링되고 p42.174 NT 또는 대안적인 스캐폴드를 갖는 p42 플라스미드 안으로 클로닝되었다. 이것은 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 NEB로부터 Esp3I 제한 효소(New England BioLabs Cat# R0734L)를 사용하여 골든 게이트 어셈블리에 의해 수행되었다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로 적격인 Turbo 컴피턴트 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
pGP2 당단백질 플라스미드 클로닝
VSV-G 당단백질 및 CMV 프로모터를 인코딩하는 서열은 In-Fusion 클로닝에 적합한 프라이머 및 제조업체의 프로토콜에 따라 Kapa HiFi DNA 폴리머라제를 사용하여 pMD2.G(UC Berkeley)로부터 증폭되었다. 백본은 카나마이신 내성 플라스미드로부터 취해지고 동일한 방법을 사용하여 증폭되었다. 이들은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 이들 단편은 제조업체 프로토콜에 따라 Takara로부터 In-Fusion® HD Cloning Kit(Cat 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
세포 배양 및 형질감염
HEK293T Lenti-X 세포를 HEPES 및 글루타맥스(Thermo Fisher)를 갖는 10% FBS 보충 DMEM에서 유지하였다. 세포를 15cm 접시에 20mL의 배지에서 접시당 20 x 106 세포로 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 표 21의 XDP 구조적 플라스미드(또한 CasX 변이체를 인코딩함)를 13 내지 80.0μg 범위의 양으로 사용하였다. 각 형질감염은 또한 13μg의 p42.174.12.7과 0.25μg의 pGP2를 수용했다. 그런 다음 폴리에틸렌이민(PEI Max, Polyplus)을 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 플레이트로부터 흡인하고 Opti-MEM(Thermo Fisher)으로 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 0.45μM 필터를 통해 여과했다. 상등액을 농축하고 NTE(50mM Tris-HCL, 100mM NaCl, 10% 수크로스, pH 7.4) 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리를 통해 정제했다. XDP는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 300μL의 DMEM/F12에 재현탁되었다.
재현탁 및 형질도입
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM/F12에서 성장되었다. 세포를 StemPro Accutase Cell Dissociation Reagent를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 성장되도록 한 후 순수 재현탁된 바이러스로 시작하여 5 하프-로그 희석액을 통해 진행하는 표적화 XDP(tdTomato에 대한 스페이서를 가짐)에 대해 처리했다. 그런 다음 세포를 1000g에서 15분 동안 원심분리하였다. NPC는 tdTomato의 편집 마커로서 형광을 분석하기 전에 96시간 동안 성장되었다. 검정은 유사한 결과로 각 샘플에 대해 2-3회 실행되었다. 단일 검정에 대한 편집 결과는 표 21에 나타나 있다.
결과
편집 결과는 검정의 조건 하에서 35개의 대안적인 구성의 대부분이 적어도 10% 또는 초과의 편집으로 NPC를 편집할 수 있었고 7개 버전은 >80% 편집을 나타내는 것으로 확인되었다. 부가적으로, Gag의 HIV 구조적 성분 중 일부는 필요하지 않은 것으로 확인되었으며, 편집은 매트릭스(MA) 성분만 CasX에 연결되는 일 구성에서 관찰되었다. 숙주 세포로부터 발아를 촉진하는 p1/p6 성분은 모든 버전에서 높은 편집의 수준(>= 70%, V1, V7, V8, V33, V34, V40, V123, V124)과 연관되어 있어 이 성분이 효능에 중요하다는 것을 시사한다. 버전 34, 40 및 123과 같이 NC가 없는 입자는 높은 편집의 수준을 달성할 수 있었던 반면, CA가 없는 입자(예컨대 버전 17)는 낮은 편집의 수준(37%)을 가졌다. 결과는 또한 버전 7, 8, 40, 123 및 124에 의해 입증된 바와 같이 XDP가 높은 수준의 편집 효능을 유지하는 데 프로테아제 성분이 필요하지 않다는 것을 입증했다. 더욱이, NC의 성분인 p2는 또한 122(MA-CA-p1/p6)가 p2를 갖지 않고 44.4% 편집을 달성하고 버전 128(MA-CA-p2-p1/p6)은 p2를 포함하고 29.2% 편집만을 아카이브하는 표 XX에서 버전 122와 128을 비교할 때 나타난 바와 같이 효능에 유해하였다. 부가하여, 다중 p1/p6을 갖는 작제물은 도 35에 도시된 바와 같이 편집을 증강시키는 데 기여할 수 있으나(버전 122 대 123), 이것은 다른 구성; 예를 들어, 버전 7(MA-CA-NC-p1/p6-X) 대 버전 124(MA-CA-NC-p1/p6-p1/p6)의 경우에는 입증되지 않았으며, 여기서 버전 7은 92.2% 편집을 달성하고 버전 124는 72.3% 편집만을 달성하였다.
전반적으로, 결과는 검정의 조건 하에서 XDP의 다중 구성이 진핵 세포로 CasX 및 가이드 RNA 치료 페이로드를 전달할 수 있는 입자를 성공적으로 어셈블리할 수 있어 표적 핵산의 편집을 초래할 수 있음을 뒷받침한다.
[표 21]: 버전 구성에 의한, XDP 작제물에 의한 NPC의 편집.
Figure pct00098
Figure pct00099
Figure pct00100
*% 편집은 5개 희석의 평균 복제물의 최대 편집 백분율을 취함에 의해 계산되었다.
[표 22]: 가이드 및 당단백질에 대한 인코딩 서열
Figure pct00101
[표 23]: XDP 버젼 및 성분 인코딩 서열
Figure pct00102
Figure pct00103
Figure pct00104
실시예 22: 레트로바이러스로부터 유래된 Gag-(-1)-프로테아제-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경되고 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변경된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 RNP의 사용은 또한 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 레트로바이러스과 패밀리의 다른 속에서 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이다. 다음 실험에서 조사된 속에는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스가 포함된다.
XDP의 생성을 위한 방법
Gag-프로테아제-CasX 변이(버전 44 및 45; 도 52a 참조)의 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 각각 Gag-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP40 및 pXDP41 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에 융합된 CasX 491 단백질을 함유한다. TSCYHCGT(서열번호: 944) 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 46, 47, 62 및 90; 도 52b 참조)에서 베타레트로바이러스(풍토병성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))에서 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. DCLDFDND(서열번호: 934), DLVLLSAE(서열번호: 935), PQVMAAVA(서열번호: 936) 및 PQVMAAVA(서열번호: 936) 절단 부위는 각각 pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 48, 49 및 63)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP45, pXDP46, 및 pXDP62 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. PAILPIIS(서열번호: 945), PQVLPVMH(서열번호: 946) 및 PQVLPVMH(서열번호: 946) 절단 부위는 각각 pXDP45, pXDP46 및 pXDP62 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 50)에서 엡실론레트로바이러스(월아이 진피 육종 바이러스(WDSV))로부터 유래된 XDP는 각각 Gag-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP47 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. ARQMTAHT(서열번호 937) 절단 부위는 pXDP47 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 51 및 52)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 54a에 묘사되고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP48 및 pXDP49 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SSLYPVLP(서열번호: 938) 및 SSLYPALT(서열번호: 939) 절단 부위는 각각 pXDP48 및 pXDP49 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버젼 53, 54, 55 및 91)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적인 형질감염에 의해 생성되었다. pXDP50, pXDP51, pXDP52, pXDP53 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. AGGRSWKA(서열번호: 940), SEEYPIMI(서열번호: 941), GGNYPVQQ(서열번호: 942) 및 REVYPIVN(서열번호: 943) 절단 부위는 각각 pXDP50, pXDP51, pXDP52, pXDP53 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 56, 57, 58, 59, 60, 61 및 92)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SAVHSVRL(서열번호: 784), RTVNTVRV(서열번호: 785), NTVHTVRQVES(서열번호: 786), AAVHTVKA(서열번호: 787), RTVNTVTT(서열번호: 788) 및 RSVNTVTA(서열번호: 789) 절단 부위는 각각 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
[표 24]: XDP 버전에 대한 플라스미드 인코딩 서열
Figure pct00105
Figure pct00106
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지 내 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP40(151μg), pXDP41(151μg), pXDP42(157μg), pXDP43(157μg), pXDP44(159μg), pXDP45(145μg), pXDP46(149μg), pXDP47(152μg), pXDP48(148μg), pXDP49(149μg), pXDP50(145μg), pXDP51(146μg), pXDP52(147μg), pXDP53(144μg), pXDP54(149μg), pXDP55(153μg), pXDP56(154μg), pXDP57(150μg), pXDP58(146μg), pXDP59(154μg), pXDP60(154μg), pXDP61(159μg), pXDP62(149μg), pXDP63(147μg), pXDP88(146μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2가 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장하였다. pXDP88로 만든 버전 29 XDP는 다양한 레트로바이러스의 Gag-Pro-Stx 버전을 테스트하는 이들 실험을 위한 HIV 렌티바이러스 대조군이다.
결과: 편집 검정의 결과는 하기 도 69a 및 b, 도 70 및 표 25 및 표 26에 나타나 있다. 도 69a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 70은 16.6μl의 농축된 XDP prep이 tdTomato NPC를 처리하는 데 사용될 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 25 및 26은 50μl 및 16.6μl의 농축된 XDP prep이 NPC를 처리하는 데 사용될 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 여러 다른 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 25]: 1차 희석액(50μl)에 대한 편집 검정의 결과
Figure pct00107
Figure pct00108
[표 26]: 2차 희석액(16.6μl)에 대한 편집 검정의 결과
Figure pct00109
Figure pct00110
실시예 23: 레트로바이러스로부터 유래된 MA-CA-CasX 구성에서 XDP 작제물의 형질감염 및 회수
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속에서 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이었다. 다음 실험에서 조사된 속은 MA-CA-CasX 구성의 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 비-영장류 렌티바이러스를 포함하며, 이에 의해 NC 및 프로테아제 도메인을 제거한다.
방법
XDP의 생성을 위한 방법
MA-CA-CasX 변이(버전 66a 및 67a; 도 55b 참조)에서 알파레트로바이러스(ALV 및 RSV)로부터 유래된 XDP는 각각 MA-CA-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP64 및 pXDP65 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 491 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 68A, 69A, 70A 및 87A, 도 56b)에서 베타레트로바이러스(ENTV, MMTV 및 MPMV)로부터 유래된 XDP는 각각 MA-CA-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP66, pXDP67, pXDP68 및 pXDP85 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 71A, 72A 및 88A, 도 57b)에서 델타레트로바이러스(BLV 및 HTLV1)로부터 유래된 XDP는 도 57b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP69, pXDP70 및 pXDP86 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 73A, 도 58b)에서 엡실론레트로바이러스(WDSV)로부터 유래된 XDP는 도 58b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP71 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 74A 및 75A, 도 59b)에서 감마레트로바이러스(FLV 및 MMLV)로부터 유래된 XDP는 도 59b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP72 및 pXDP73 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 76A, 77A, 78A, 79A 및 89A, 도 60b)에서 비-영장류 렌티바이러스(CAEV, EIAV, SIV 및 VMV)로부터 유래된 XDP는 도 60b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP74, pXDP75, pXDP76, pXDP77 및 pXDP87 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
[표 27]: XDP 버전에 대한 플라스미드 인코딩 서열
Figure pct00111
Figure pct00112
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양을 구조적 플라스미드에 개별적으로 사용했다: pXDP64(143μg), pXDP65(143μg), pXDP66(142μg), pXDP67(143μg), pXDP68(144μg), pXDP69(136μg), pXDP70(137μg), pXDP71(141μg), pXDP72(140μg), pXDP73(142μg), pXDP74(134μg), pXDP75(134μg), pXDP76(134μg), pXDP85(144μg), pXDP86(137μg), pXDP87(138μg), pXDP32(114μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지 내 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 71a 및 b, 도 72 및 표 28 및 29에 도시되어 있다. 도 73a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 72는 16.6μl의 농축된 XDP prep을 사용하여 tdTomato NPC를 처리할 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 28 및 29는 50μl 및 16.6μl의 농축된 XDP prep을 사용하여 NPC를 처리할 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 MA-CA-X 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 28]: 제1 희석액(50ul)에 대한 편집 검정의 결과
Figure pct00113
[표 29]: 제2 희석액(16.6μl)에 대한 편집 검정의 결과
Figure pct00114
실시예 24: 레트로바이러스로부터 유래된 Gag-(-1)-프로테아제-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경되고 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변경된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 RNP의 사용은 또한 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 레트로바이러스과 패밀리의 다른 속으로부터 유래된 고유한 CasX 전달 입자를 생성하고 동정하는 것이다. 다음 실험에서 조사된 속은 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스를 포함한다.
XDP의 생성을 위한 방법
Gag-프로테아제-CasX 변이(버전 44 및 45; 도 52a 참조)에서 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 도 52a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP40 및 pXDP41 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 491 단백질을 함유한다. TSCYHCGT(서열번호: 944) 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 46, 47, 62 및 90; 도 52b 참조)에서 베타레트로바이러스(동물성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))로부터 유래된 XDP는 도 52b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. DCLDFDND(서열번호: 934), DLVLLSAE(서열번호: 935), PQVMAAVA(서열번호: 936) 및 PQVMAAVA(서열번호: 936) 절단 부위는 각각 pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 48, 49 및 63; 도 53a 참조)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 도 53a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP45, pXDP46 및 pXDP62 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. PAILPIIS(서열번호: 945), PQVLPVMH(서열번호: 946) 및 PQVLPVMH(서열번호: 946) 절단 부위는 각각 pXDP45, pXDP46 및 pXDP62 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 50; 도 53b 참조)에서 엡실론레트로바이러스(월아이 피부 육종 바이러스(WDSV))로부터 유래된 XDP는 도 53b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP47 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. ARQMTAHT(서열번호: 937) 절단 부위는 pXDP47 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 51 및 52; 도 54a 참조)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 54a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP48 및 pXDP49 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SSLYPVLP(서열번호: 938) 및 SSLYPALT(서열번호: 939) 절단 부위는 각각 pXDP48 및 pXDP49 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 53, 54, 55 및 91; 도 54b 참조)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 도 54b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP50, pXDP51, pXDP52, pXDP53 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. AGGRSWKA(서열번호: 940), SEEYPIMI(서열번호: 941), GGNYPVQQ(서열번호: 942) 및 REVYPIVN(서열번호: 943) 절단 부위는 각각 pXDP50, pXDP51, pXDP52, pXDP53 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 56, 57, 58, 59, 60, 61 및 92; 도 55a 참조)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 도 55a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SAVHSVRL(서열번호: 784), RTVNTVRV(서열번호: 785), NTVHTVRQVES(서열번호: 786), AAVHTVKA(서열번호: 787), RTVNTVTT(서열번호: 788) 및 RSVNTVTA(서열번호: 789) 절단 부위는 각각 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
[표 30]: 플라스미드 및 XDP 인코딩 서열
Figure pct00115
Figure pct00116
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 도시되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP40(151μg), pXDP41(151μg), pXDP42(157μg), pXDP43(157μg), pXDP44(159μg), pXDP45(145μg) , pXDP46(149μg), pXDP47(152μg), pXDP48(148μg), pXDP49(149μg), pXDP50(145μg), pXDP51(146μg), pXDP52(147μg), pXDP53(144μg), pXDP54(149μg), pXDP55(153μg), pXDP56(154μg), pXDP57(150μg), pXDP58(146μg), pXDP59(154μg), pXDP60(154μg), pXDP61(159μg), pXDP62(149μg), pXDP63(147μg), pXDP88(146μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP88로 만든 버전 29 XDP는 다양한 레트로바이러스의 Gag-Pro-Stx 버전을 시험하는 이들 실험에 대한 HIV 렌티바이러스 대조군이다.
결과: 편집 검정의 결과는 하기 도 69a 및 b와 표 31 및 표 32에 나타나 있다. 도 69a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 표 31 및 32는 50μl 및 16.6μl의 농축된 XDP prep이 사용되어 NPC를 처리할 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 여러 다른 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 31]: 1차 희석액(50μl)에 대한 편집 검정의 결과
Figure pct00117
Figure pct00118
[표 32]: 2차 희석액(16.6μl)에 대한 편집 검정의 결과
Figure pct00119
Figure pct00120
실시예 25: 레트로바이러스로부터 유래된 Gag-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속에서 유래된 고유한 CasX 전달 입자를 생성하고 동정하는 것이다. 다음 실험에서 조사된 속은 Gag-CasX 구성의 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 비-영장류 렌티바이러스를 포함한다. 실험은 HIV 렌티바이러스 기반 V7 작제물과 직접적인 비교인 것으로 의미되었으며, Gag 성분은 XDP가 Gag로부터 요구된 활성 방출을 편집할 수 있는지 여부를 시험하기 위해 모든 작제물에서 제거된 프로테아제 도메인을 갖는, 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스의 상응하는 Gag 성분으로 대체되었다.
XDP의 생성을 위한 방법
Gag-CasX 변이(V102 및 V114; 도 62b 참조)에서 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 도 62b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP127 및 pXDP139 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V106, V111, V112 및 V113, 도 64a)에서 베타레트로바이러스(풍토병성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))로부터 유래된 XDP는 도 64a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP131, pXDP136, pXDP137 및 pXDP138 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(버전 V103, V108 및 V109, 도 63a)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 도 63a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP128, pXDP133 및 pXDP134 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(버전 73A, 도 58b)에서 엡실론레트로바이러스(월아이 피부 육종 바이러스(WDSV))로부터 유래된 XDP는 도 58b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP127 및 pXDP139 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V107 및 V110, 도 64b)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 64b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP132 및 pXDP135 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V104, V105, V115, V116 및 V117, 도 63b)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 도 63b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP129, pXDP130, pXDP140, pXDP141 및 pXDP142 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V80a, V81a, V82a, V83a, V84a, V85a 및 V86a; 도 62a 참조)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 도 62a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP78, pXDP79, pXDP80, pXDP81, pXDP82, pXDP83 및 pXDP84 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
[표 33]: XDP 플라스미드 및 인코딩 서열
Figure pct00121
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 도시되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포에서 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양을 구조적 플라스미드에 개별적으로 사용했다: pXDP127(146μg), pXDP129(141μg), pXDP130(143μg), pXDP131(145μg), pXDP132(143μg), pXDP135(145μg), pXDP136(152μg), pXDP138(149μg), pXDP139(146μg), pXDP140(143μg), pXDP141(143μg), pXDP142(141μg), pXDP143(146μg), pXDP78(145μg), pXDP81(141μg), pXDP82(139μg), pXDP83(145μg), pXDP0017(122μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 75a 및 b, 도 76 그리고 표 34 및 표 35에 도시되어 있다. 도 75a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 표 34 및 35는 50ul 및 16.6ul의 농축된 XDP prep을 사용하여 NPC를 처리할 때 tdTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 Gag-CasX 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 4% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 34]: 1차 희석액(50ul)에 대한 편집 검정의 결과
Figure pct00122
[표 35]: 2차 희석액(16.6ul)에 대한 편집 검정의 결과
Figure pct00123
실시예 26: 스푸마레트로바이러스아과로부터 유래된 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증진될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속으로부터 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이었다. 다음 실험에서 조사된 속은 Gag-CasX + Gag-(-1)-프로테아제-CasX 구성에서의 스푸마레트로바이러스를 포함한다. 여기에서 본 발명자들은 Gag-CasX 폴리단백질과 함께 Gag-프로테아제-CasX 폴리단백질을 갖는 다른 양의 프로테아제를 추가함에 의해 단백질분해 절단에 의해 매개되는 XDP 입자 형성 및 성숙을 잠재적으로 개선할 수 있었음을 가정했다.
방법
XDP의 생성을 위한 방법
90% Gag-CasX + 10% Gag-(-1)-프로테아제-CasX 변이(V80b, V81b, V82b, V83b, V84b, V85b 및 V86b; 도 62a 참조)에서 스푸마레트로바이러스아과 패밀리(BFV, EFV, FFV, BGPFV, RHSFV 및 SFV)로부터 유래된 XDP는 도 62a에 묘사되고 표 36에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. 플라스미드 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60은 이전 실시예에서 기술되었다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 36 및 A에 제시되어 있다.
[표 36]: 플라스미드 서열
Figure pct00124
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포에서 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP78 + pXDP54(146μg + 15μg), pXDP81 + pXDP57(150μg + 15μg), pXDP82 + pXDP58(146μg + 15μg), pXDP83 + pXDP59(154μg + 15.4μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 37℃에서 48시간 동안 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato용 스페이서를 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 73a 및 b, 도 74 그리고 표 37 및 표 38에 도시되어 있다. 도 73a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 74는 16.6μl의 농축된 XDP prep이 tdTomato NPC를 처리하는 데 사용될 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 37과 38은 50μl 및 16.6μl의 농축된 XDP prep을 NPC를 처리하는 데 사용했을 때 dtTomato 표적 서열의 % 편집을 보여주는 결과를 나타낸다. 결과는 검정의 조건 하에서, XDP의 90% Gag-CasX + 10% Gag-프로테아제-CasX 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 37]: 1차 희석액(50ul)에 대한 편집 검정의 결과
Figure pct00125
[표 38]: 2차 희석액(16.6ul)에 대한 편집 검정의 결과
Figure pct00126
SEQUENCE LISTING <110> Scribe Therapeutics Inc. <120> PARTICLE DELIVERY SYSTEMS <130> SCRB-024/05WO 333322-2107 <150> US 63/120,864 <151> 2020-12-03 <150> US 63/035,576 <151> 2020-06-05 <150> US 62/983,460 <151> 2002-02-28 <150> US 62/968,915 <151> 2020-01-31 <150> US 62/944,982 <151> 2019-12-06 <160> 1010 <170> PatentIn version 3.5 <210> 1 <211> 986 <212> PRT <213> Unknown <220> <223> Deltaproteobacteria sp. <400> 1 Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn 1 5 10 15 Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val 20 25 30 Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys 35 40 45 Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn 50 55 60 Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu 65 70 75 80 Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys 85 90 95 Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys 100 105 110 Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys 115 120 125 Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser 130 135 140 Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala 145 150 155 160 Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp 165 170 175 Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg 325 330 335 Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys 340 345 350 Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val 355 360 365 Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro 370 375 380 Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys 385 390 395 400 Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys 405 410 415 Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg 420 425 430 Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu 435 440 445 Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp 450 455 460 Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp 465 470 475 480 Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly 485 490 495 Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val 500 505 510 Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr 515 520 525 Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe 530 535 540 Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp 545 550 555 560 Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly 565 570 575 Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu 580 585 590 Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu 595 600 605 Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu 610 615 620 Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly 625 630 635 640 Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu 645 650 655 Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp 660 665 670 Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly 675 680 685 Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile 690 695 700 Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala 705 710 715 720 Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe 725 730 735 Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala 740 745 750 Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe 755 760 765 Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met 770 775 780 Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu 785 790 795 800 Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala 805 810 815 Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr 820 825 830 Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly 835 840 845 Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile 850 855 860 Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser 865 870 875 880 Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser 885 890 895 Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys 900 905 910 Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys 915 920 925 Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg 930 935 940 Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys 945 950 955 960 Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg 965 970 975 Arg Leu Lys Glu Val Trp Lys Pro Asn Ala 980 985 <210> 2 <211> 978 <212> PRT <213> Unknown <220> <223> Planctomycetes sp. <400> 2 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 3 <211> 855 <212> PRT <213> Unknown <220> <223> Candidatus sungbacteria sp. <400> 3 Met Asp Asn Ala Asn Lys Pro Ser Thr Lys Ser Leu Val Asn Thr Thr 1 5 10 15 Arg Ile Ser Asp His Phe Gly Val Thr Pro Gly Gln Val Thr Arg Val 20 25 30 Phe Ser Phe Gly Ile Ile Pro Thr Lys Arg Gln Tyr Ala Ile Ile Glu 35 40 45 Arg Trp Phe Ala Ala Val Glu Ala Ala Arg Glu Arg Leu Tyr Gly Met 50 55 60 Leu Tyr Ala His Phe Gln Glu Asn Pro Pro Ala Tyr Leu Lys Glu Lys 65 70 75 80 Phe Ser Tyr Glu Thr Phe Phe Lys Gly Arg Pro Val Leu Asn Gly Leu 85 90 95 Arg Asp Ile Asp Pro Thr Ile Met Thr Ser Ala Val Phe Thr Ala Leu 100 105 110 Arg His Lys Ala Glu Gly Ala Met Ala Ala Phe His Thr Asn His Arg 115 120 125 Arg Leu Phe Glu Glu Ala Arg Lys Lys Met Arg Glu Tyr Ala Glu Cys 130 135 140 Leu Lys Ala Asn Glu Ala Leu Leu Arg Gly Ala Ala Asp Ile Asp Trp 145 150 155 160 Asp Lys Ile Val Asn Ala Leu Arg Thr Arg Leu Asn Thr Cys Leu Ala 165 170 175 Pro Glu Tyr Asp Ala Val Ile Ala Asp Phe Gly Ala Leu Cys Ala Phe 180 185 190 Arg Ala Leu Ile Ala Glu Thr Asn Ala Leu Lys Gly Ala Tyr Asn His 195 200 205 Ala Leu Asn Gln Met Leu Pro Ala Leu Val Lys Val Asp Glu Pro Glu 210 215 220 Glu Ala Glu Glu Ser Pro Arg Leu Arg Phe Phe Asn Gly Arg Ile Asn 225 230 235 240 Asp Leu Pro Lys Phe Pro Val Ala Glu Arg Glu Thr Pro Pro Asp Thr 245 250 255 Glu Thr Ile Ile Arg Gln Leu Glu Asp Met Ala Arg Val Ile Pro Asp 260 265 270 Thr Ala Glu Ile Leu Gly Tyr Ile His Arg Ile Arg His Lys Ala Ala 275 280 285 Arg Arg Lys Pro Gly Ser Ala Val Pro Leu Pro Gln Arg Val Ala Leu 290 295 300 Tyr Cys Ala Ile Arg Met Glu Arg Asn Pro Glu Glu Asp Pro Ser Thr 305 310 315 320 Val Ala Gly His Phe Leu Gly Glu Ile Asp Arg Val Cys Glu Lys Arg 325 330 335 Arg Gln Gly Leu Val Arg Thr Pro Phe Asp Ser Gln Ile Arg Ala Arg 340 345 350 Tyr Met Asp Ile Ile Ser Phe Arg Ala Thr Leu Ala His Pro Asp Arg 355 360 365 Trp Thr Glu Ile Gln Phe Leu Arg Ser Asn Ala Ala Ser Arg Arg Val 370 375 380 Arg Ala Glu Thr Ile Ser Ala Pro Phe Glu Gly Phe Ser Trp Thr Ser 385 390 395 400 Asn Arg Thr Asn Pro Ala Pro Gln Tyr Gly Met Ala Leu Ala Lys Asp 405 410 415 Ala Asn Ala Pro Ala Asp Ala Pro Glu Leu Cys Ile Cys Leu Ser Pro 420 425 430 Ser Ser Ala Ala Phe Ser Val Arg Glu Lys Gly Gly Asp Leu Ile Tyr 435 440 445 Met Arg Pro Thr Gly Gly Arg Arg Gly Lys Asp Asn Pro Gly Lys Glu 450 455 460 Ile Thr Trp Val Pro Gly Ser Phe Asp Glu Tyr Pro Ala Ser Gly Val 465 470 475 480 Ala Leu Lys Leu Arg Leu Tyr Phe Gly Arg Ser Gln Ala Arg Arg Met 485 490 495 Leu Thr Asn Lys Thr Trp Gly Leu Leu Ser Asp Asn Pro Arg Val Phe 500 505 510 Ala Ala Asn Ala Glu Leu Val Gly Lys Lys Arg Asn Pro Gln Asp Arg 515 520 525 Trp Lys Leu Phe Phe His Met Val Ile Ser Gly Pro Pro Pro Val Glu 530 535 540 Tyr Leu Asp Phe Ser Ser Asp Val Arg Ser Arg Ala Arg Thr Val Ile 545 550 555 560 Gly Ile Asn Arg Gly Glu Val Asn Pro Leu Ala Tyr Ala Val Val Ser 565 570 575 Val Glu Asp Gly Gln Val Leu Glu Glu Gly Leu Leu Gly Lys Lys Glu 580 585 590 Tyr Ile Asp Gln Leu Ile Glu Thr Arg Arg Arg Ile Ser Glu Tyr Gln 595 600 605 Ser Arg Glu Gln Thr Pro Pro Arg Asp Leu Arg Gln Arg Val Arg His 610 615 620 Leu Gln Asp Thr Val Leu Gly Ser Ala Arg Ala Lys Ile His Ser Leu 625 630 635 640 Ile Ala Phe Trp Lys Gly Ile Leu Ala Ile Glu Arg Leu Asp Asp Gln 645 650 655 Phe His Gly Arg Glu Gln Lys Ile Ile Pro Lys Lys Thr Tyr Leu Ala 660 665 670 Asn Lys Thr Gly Phe Met Asn Ala Leu Ser Phe Ser Gly Ala Val Arg 675 680 685 Val Asp Lys Lys Gly Asn Pro Trp Gly Gly Met Ile Glu Ile Tyr Pro 690 695 700 Gly Gly Ile Ser Arg Thr Cys Thr Gln Cys Gly Thr Val Trp Leu Ala 705 710 715 720 Arg Arg Pro Lys Asn Pro Gly His Arg Asp Ala Met Val Val Ile Pro 725 730 735 Asp Ile Val Asp Asp Ala Ala Ala Thr Gly Phe Asp Asn Val Asp Cys 740 745 750 Asp Ala Gly Thr Val Asp Tyr Gly Glu Leu Phe Thr Leu Ser Arg Glu 755 760 765 Trp Val Arg Leu Thr Pro Arg Tyr Ser Arg Val Met Arg Gly Thr Leu 770 775 780 Gly Asp Leu Glu Arg Ala Ile Arg Gln Gly Asp Asp Arg Lys Ser Arg 785 790 795 800 Gln Met Leu Glu Leu Ala Leu Glu Pro Gln Pro Gln Trp Gly Gln Phe 805 810 815 Phe Cys His Arg Cys Gly Phe Asn Gly Gln Ser Asp Val Leu Ala Ala 820 825 830 Thr Asn Leu Ala Arg Arg Ala Ile Ser Leu Ile Arg Arg Leu Pro Asp 835 840 845 Thr Asp Thr Pro Pro Thr Pro 850 855 <210> 4 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 4 acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60 gaagcgcuua uuuaucggag agaaaccgau aaguaaaacg caucaaag 108 <210> 5 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 5 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 6 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 6 acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60 gaagcgcuua uuuaucggag a 81 <210> 7 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 7 acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60 gaagcgcuua uuuaucgg 78 <210> 8 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 8 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga 80 <210> 9 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 9 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucgg 77 <210> 10 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 10 guuuacacac ucccucucau agggu 25 <210> 11 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 11 guuuacacac ucccucucau gaggu 25 <210> 12 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 12 uuuuacauac ccccucucau gggau 25 <210> 13 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 13 guuuacacac ucccucucau ggggg 25 <210> 14 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 14 ccagcgacua ugucguaugg 20 <210> 15 <211> 39 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 15 gcgcuuauuu aucggagaga aauccgauaa auaagaagc 39 <210> 16 <211> 74 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 16 ggcgcuuuua ucucauuacu uugagagcca ucaccagcga cuaugucgua uggguaaagc 60 gcuuauuuau cgga 74 <210> 17 <211> 7 <212> PRT <213> Unknown <220> <223> TEV protease cleavage site <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa is any amino acid <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is any amino acid <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa is Gly or Ser <400> 17 Glu Xaa Xaa Tyr Xaa Gln Xaa 1 5 <210> 18 <211> 7 <212> PRT <213> Unknown <220> <223> TEV protease cleavage site <400> 18 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 19 <211> 7 <212> PRT <213> Unknown <220> <223> TEV protease cleavage site <400> 19 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 20 <211> 8 <212> PRT <213> Unknown <220> <223> HIV-1 cleavage site <400> 20 Ser Gln Asn Tyr Pro Ile Val Gln 1 5 <210> 21 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 21 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys 100 105 110 Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe 115 120 125 Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln 130 135 140 Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu 165 170 175 Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His 195 200 205 Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser 225 230 235 240 Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile 245 250 255 Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala 260 265 270 Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu 305 310 315 320 Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 22 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 22 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Thr Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser 820 825 830 Asp Gly Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu 850 855 860 Leu Ser Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp 865 870 875 880 Ile Ser Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu 900 905 910 Asp Cys Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 23 <211> 985 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 23 Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn 1 5 10 15 Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val 20 25 30 Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys 35 40 45 Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn 50 55 60 Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu 65 70 75 80 Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys 85 90 95 Lys Phe Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile 100 105 110 Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys 115 120 125 Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn 130 135 140 Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser 145 150 155 160 Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn 165 170 175 Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu 180 185 190 Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys 195 200 205 Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly 210 215 220 Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser 225 230 235 240 Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn 245 250 255 Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu 260 265 270 Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly 275 280 285 Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn 290 295 300 Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro 305 310 315 320 Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg Arg 325 330 335 Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys Leu 340 345 350 Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val Thr 355 360 365 Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro Asn 370 375 380 Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys Lys 385 390 395 400 Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys Lys 405 410 415 Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg Ile 420 425 430 Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu Ala 435 440 445 Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp Leu 450 455 460 Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp Glu 465 470 475 480 Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly Asp 485 490 495 Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val Asp 500 505 510 Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr Arg 515 520 525 Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe Tyr 530 535 540 Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp Gly 545 550 555 560 Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly Gly 565 570 575 Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu Gln 580 585 590 Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu Phe 595 600 605 Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu Ala 610 615 620 Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly Arg 625 630 635 640 Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val 645 650 655 Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp Arg 660 665 670 Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys 675 680 685 Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile Leu 690 695 700 Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala Ala 705 710 715 720 Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe Ala 725 730 735 Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala Arg 740 745 750 Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe Glu 755 760 765 Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Thr 770 775 780 Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu Ala 785 790 795 800 Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln 805 810 815 Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr Ala 820 825 830 Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly Trp 835 840 845 Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile Thr 850 855 860 Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser Ala 865 870 875 880 Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser Lys 885 890 895 Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys Arg 900 905 910 Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys Gly 915 920 925 His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser 930 935 940 Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys Ser 945 950 955 960 Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg Arg 965 970 975 Leu Lys Glu Val Trp Lys Pro Asn Ala 980 985 <210> 24 <211> 986 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 24 Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn 1 5 10 15 Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val 20 25 30 Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys 35 40 45 Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn 50 55 60 Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu 65 70 75 80 Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys 85 90 95 Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys 100 105 110 Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys 115 120 125 Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser 130 135 140 Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala 145 150 155 160 Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp 165 170 175 Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg 325 330 335 Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys 340 345 350 Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val 355 360 365 Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro 370 375 380 Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys 385 390 395 400 Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys 405 410 415 Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg 420 425 430 Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu 435 440 445 Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp 450 455 460 Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp 465 470 475 480 Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly 485 490 495 Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val 500 505 510 Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr 515 520 525 Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe 530 535 540 Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp 545 550 555 560 Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly 565 570 575 Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu 580 585 590 Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu 595 600 605 Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu 610 615 620 Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly 625 630 635 640 Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu 645 650 655 Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp 660 665 670 Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly 675 680 685 Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile 690 695 700 Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala 705 710 715 720 Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe 725 730 735 Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala 740 745 750 Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe 755 760 765 Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met 770 775 780 Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu 785 790 795 800 Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala 805 810 815 Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser 820 825 830 Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly 835 840 845 Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile 850 855 860 Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser 865 870 875 880 Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser 885 890 895 Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys 900 905 910 Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys 915 920 925 Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg 930 935 940 Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys 945 950 955 960 Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg 965 970 975 Arg Leu Lys Glu Val Trp Lys Pro Asn Ala 980 985 <210> 25 <211> 921 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 25 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Val Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro 675 680 685 Thr Asp Ile Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Phe Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Ser Ala Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val 740 745 750 Leu Val Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala 915 920 <210> 26 <211> 920 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 26 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala 915 920 <210> 27 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 27 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Asn Ala Ala 50 55 60 Asn Asn Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala 65 70 75 80 Ile Leu Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu 85 90 95 Met Cys Lys Phe Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 28 <211> 986 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 28 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu 325 330 335 Arg Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys 340 345 350 Lys Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly 355 360 365 Val Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu 370 375 380 Pro Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro 385 390 395 400 Lys Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu 405 410 415 Lys Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu 420 425 430 Arg Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu 435 440 445 Glu Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp 450 455 460 Trp Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met 465 470 475 480 Asp Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr 485 490 495 Gly Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Ser Ile 500 505 510 Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp 515 520 525 Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr 530 535 540 Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe 545 550 555 560 Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile 565 570 575 Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile 580 585 590 Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn 595 600 605 Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg 610 615 620 Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro 625 630 635 640 Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser 645 650 655 Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn 660 665 670 Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser 675 680 685 Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly 690 695 700 Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val 705 710 715 720 Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala 725 730 735 Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu 740 745 750 Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser 755 760 765 Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln 770 775 780 Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly 785 790 795 800 Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys 805 810 815 Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg 820 825 830 Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile 835 840 845 Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg 850 855 860 Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg 865 870 875 880 Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly 885 890 895 Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg 900 905 910 Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His 915 920 925 Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu 930 935 940 Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn 945 950 955 960 Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys 965 970 975 Lys Leu Lys Glu Val Trp Lys Pro Ala Val 980 985 <210> 29 <211> 925 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 29 Met Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp 1 5 10 15 Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe 20 25 30 Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro 35 40 45 Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu 50 55 60 Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu 65 70 75 80 Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr 85 90 95 Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu 100 105 110 Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser 115 120 125 Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val 130 135 140 Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly 145 150 155 160 Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys 165 170 175 Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu 180 185 190 Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu 195 200 205 Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu 210 215 220 Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val 225 230 235 240 Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu 245 250 255 Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe 260 265 270 Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp 275 280 285 Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp 290 295 300 Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala 305 310 315 320 Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys 325 330 335 Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys 340 345 350 His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile 355 360 365 Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu 370 375 380 Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu 385 390 395 400 Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys 405 410 415 Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp 420 425 430 Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Arg Val Val Asp 435 440 445 Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr Arg 450 455 460 Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe Tyr 465 470 475 480 Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp Gly 485 490 495 Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly Gly 500 505 510 Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu Gln 515 520 525 Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu Phe 530 535 540 Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu Ala 545 550 555 560 Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly Arg 565 570 575 Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val 580 585 590 Val Asp Pro Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg 595 600 605 Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys 610 615 620 Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu 625 630 635 640 Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys 645 650 655 Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala 660 665 670 Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg 675 680 685 Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu 690 695 700 Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala 705 710 715 720 Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala 725 730 735 Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr 740 745 750 Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp 755 760 765 Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met 770 775 780 Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr 785 790 795 800 Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu 805 810 815 Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp 820 825 830 Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe 835 840 845 Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe 850 855 860 Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp 865 870 875 880 Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr 885 890 895 Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe 900 905 910 Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 915 920 925 <210> 30 <211> 975 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 30 Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn 1 5 10 15 Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val 20 25 30 Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys 35 40 45 Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Thr Ser Arg Ala Asn 50 55 60 Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu 65 70 75 80 His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser 85 90 95 Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile 100 105 110 Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys 115 120 125 Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn 130 135 140 Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser 145 150 155 160 Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn 165 170 175 Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu 180 185 190 Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys 195 200 205 Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly 210 215 220 Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr 225 230 235 240 Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn 245 250 255 Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu 260 265 270 Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly 275 280 285 Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn 290 295 300 Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro 305 310 315 320 Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln 325 330 335 Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu 340 345 350 Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala 355 360 365 Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu 370 375 380 Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu 385 390 395 400 Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr 405 410 415 Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys 420 425 430 His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys 435 440 445 Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu 450 455 460 Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys 465 470 475 480 Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu 485 490 495 Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn 500 505 510 Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr 515 520 525 Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile 530 535 540 Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys 545 550 555 560 Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp 565 570 575 Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg 580 585 590 Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys 595 600 605 Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr 610 615 620 Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg 625 630 635 640 Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile 645 650 655 Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu 660 665 670 Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His 675 680 685 Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln 690 695 700 Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys 705 710 715 720 Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr 725 730 735 Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile 740 745 750 Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe 755 760 765 Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys 770 775 780 Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala 785 790 795 800 Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser 805 810 815 Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly 820 825 830 Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile 835 840 845 Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser 850 855 860 Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser 865 870 875 880 Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys 885 890 895 Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys 900 905 910 Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg 915 920 925 Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn 930 935 940 Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln 945 950 955 960 Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 31 <211> 982 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 31 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Arg Val Val Asp Ile Ser Gly Phe Ser Ile Gly 500 505 510 Ser Asp Gly His Ser Ile Gln Tyr Arg Asn Leu Leu Ala Trp Lys Tyr 515 520 525 Leu Glu Asn Gly Lys Arg Glu Phe Tyr Leu Leu Met Asn Tyr Gly Lys 530 535 540 Lys Gly Arg Ile Arg Phe Thr Asp Gly Thr Asp Ile Lys Lys Ser Gly 545 550 555 560 Lys Trp Gln Gly Leu Leu Tyr Gly Gly Gly Lys Ala Lys Val Ile Asp 565 570 575 Leu Thr Phe Asp Pro Asp Asp Glu Gln Leu Ile Ile Leu Pro Leu Ala 580 585 590 Phe Gly Thr Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser 595 600 605 Leu Glu Thr Gly Leu Ile Lys Leu Ala Asn Gly Arg Val Ile Glu Lys 610 615 620 Thr Ile Tyr Asn Lys Lys Ile Gly Arg Asp Glu Pro Ala Leu Phe Val 625 630 635 640 Ala Leu Thr Phe Glu Arg Arg Glu Val Val Asp Pro Ser Asn Ile Lys 645 650 655 Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val 660 665 670 Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp 675 680 685 Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys 690 695 700 Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg 705 710 715 720 Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala 725 730 735 Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val 740 745 750 Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly 755 760 765 Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met 770 775 780 Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr 785 790 795 800 Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn 805 810 815 Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys 820 825 830 Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu 835 840 845 Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln 850 855 860 Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu 865 870 875 880 Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu 885 890 895 Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu 900 905 910 Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln 915 920 925 Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu 930 935 940 Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg 945 950 955 960 Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu 965 970 975 Val Trp Lys Pro Ala Val 980 <210> 32 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 32 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 33 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 33 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Ala Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala <210> 34 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 34 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 35 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 35 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Gln Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 36 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 36 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Gln Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 37 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 37 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Ile Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 38 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 38 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 39 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 39 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Thr Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 40 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 40 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Ser Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 41 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 41 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 42 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 42 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Lys Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 43 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 43 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 44 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 44 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 45 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 45 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 46 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 46 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Ser Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 47 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 47 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 48 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 48 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Asp Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 49 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 49 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Phe Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 50 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 50 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 51 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 51 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 52 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 52 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 53 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 53 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 54 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 54 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Lys Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 55 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 55 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Asn Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 56 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 56 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Met Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 57 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 57 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 58 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 58 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 59 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 59 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 60 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 60 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 61 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 61 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Val 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His 195 200 205 Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser 225 230 235 240 Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile 245 250 255 Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala 260 265 270 Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu 305 310 315 320 Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 62 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 62 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 63 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 63 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 64 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 64 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 65 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 65 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 66 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 66 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 67 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 67 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 68 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 68 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 69 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 69 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 70 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 70 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 71 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 71 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 72 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 72 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 73 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 73 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 74 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 74 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 75 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 75 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 76 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 76 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 77 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 77 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 78 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 78 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 79 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 79 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 80 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 80 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 81 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 81 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 82 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 82 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 83 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 83 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 84 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 84 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 85 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 85 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 86 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 86 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 87 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 87 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 88 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 88 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 89 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 89 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val 195 200 205 Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu 225 230 235 240 Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys 245 250 255 Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly 260 265 270 Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys 305 310 315 320 Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 90 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 90 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 91 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 91 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 92 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 92 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 93 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 93 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 94 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 94 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 95 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 95 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Met Ser Ser Gly 115 120 125 Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu 130 135 140 Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys 145 150 155 160 Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro 165 170 175 Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His 195 200 205 Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser 225 230 235 240 Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile 245 250 255 Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala 260 265 270 Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu 305 310 315 320 Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 96 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 96 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 97 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 97 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 98 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 98 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 99 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 99 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 100 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 100 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 101 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 101 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 102 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 102 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 103 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 103 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 104 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 104 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 105 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 105 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp 385 390 395 400 Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 106 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 106 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val 195 200 205 Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu 225 230 235 240 Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly 245 250 255 Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn 260 265 270 Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys 305 310 315 320 Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 107 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 107 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 108 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 108 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 109 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 109 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 110 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 110 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 111 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 111 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 112 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 112 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Gly Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 113 <211> 986 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 113 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu 325 330 335 Arg Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys 340 345 350 Lys Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly 355 360 365 Val Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu 370 375 380 Pro Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro 385 390 395 400 Lys Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu 405 410 415 Lys Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu 420 425 430 Arg Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu 435 440 445 Glu Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp 450 455 460 Trp Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met 465 470 475 480 Asp Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr 485 490 495 Gly Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Ser Ile 500 505 510 Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp 515 520 525 Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr 530 535 540 Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe 545 550 555 560 Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile 565 570 575 Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile 580 585 590 Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn 595 600 605 Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg 610 615 620 Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro 625 630 635 640 Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser 645 650 655 Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn 660 665 670 Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser 675 680 685 Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly 690 695 700 Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val 705 710 715 720 Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala 725 730 735 Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu 740 745 750 Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser 755 760 765 Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln 770 775 780 Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly 785 790 795 800 Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys 805 810 815 Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg 820 825 830 Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile 835 840 845 Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg 850 855 860 Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg 865 870 875 880 Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly 885 890 895 Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg 900 905 910 Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His 915 920 925 Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu 930 935 940 Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn 945 950 955 960 Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys 965 970 975 Lys Leu Lys Glu Val Trp Lys Pro Ala Val 980 985 <210> 114 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 114 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Val Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro 675 680 685 Thr Asp Ile Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Phe Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Ser Ala Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val 740 745 750 Leu Val Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 115 <211> 972 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 115 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser 930 935 940 Tyr Lys Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr 945 950 955 960 Lys Arg Arg Leu Lys Glu Val Trp Lys Pro Asn Ala 965 970 <210> 116 <211> 84 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 116 Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 1 5 10 15 Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser 20 25 30 Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile 35 40 45 Thr Ser Asn Gly Gly Arg Val Lys Cys Met Gln Val Trp Pro Pro Ile 50 55 60 Gly Lys Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Thr Arg 65 70 75 80 Asp Ser Arg Ala <210> 117 <211> 57 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 117 Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 1 5 10 15 Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser 20 25 30 Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile 35 40 45 Thr Ser Asn Gly Gly Arg Val Lys Ser 50 55 <210> 118 <211> 85 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 118 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys 50 55 60 Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly 65 70 75 80 Gly Arg Val Asn Cys 85 <210> 119 <211> 76 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 119 Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Gln Asn Pro Ser Leu 1 5 10 15 Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val 20 25 30 Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser 35 40 45 Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg 50 55 60 Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys 65 70 75 <210> 120 <211> 76 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 120 Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Trp Asn Pro Ser Leu 1 5 10 15 Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val 20 25 30 Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser 35 40 45 Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg 50 55 60 Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys 65 70 75 <210> 121 <211> 72 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 121 Met Ala Gln Ile Asn Asn Met Ala Gln Gly Ile Gln Thr Leu Asn Pro 1 5 10 15 Asn Ser Asn Phe His Lys Pro Gln Val Pro Lys Ser Ser Ser Phe Leu 20 25 30 Val Phe Gly Ser Lys Lys Leu Lys Asn Ser Ala Asn Ser Met Leu Val 35 40 45 Leu Lys Lys Asp Ser Ile Phe Met Gln Leu Phe Cys Ser Phe Arg Ile 50 55 60 Ser Ala Ser Val Ala Thr Ala Cys 65 70 <210> 122 <211> 69 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 122 Met Ala Ala Leu Val Thr Ser Gln Leu Ala Thr Ser Gly Thr Val Leu 1 5 10 15 Ser Val Thr Asp Arg Phe Arg Arg Pro Gly Phe Gln Gly Leu Arg Pro 20 25 30 Arg Asn Pro Ala Asp Ala Ala Leu Gly Met Arg Thr Val Gly Ala Ser 35 40 45 Ala Ala Pro Lys Gln Ser Arg Lys Pro His Arg Phe Asp Arg Arg Cys 50 55 60 Leu Ser Met Val Val 65 <210> 123 <211> 77 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 123 Met Ala Ala Leu Thr Thr Ser Gln Leu Ala Thr Ser Ala Thr Gly Phe 1 5 10 15 Gly Ile Ala Asp Arg Ser Ala Pro Ser Ser Leu Leu Arg His Gly Phe 20 25 30 Gln Gly Leu Lys Pro Arg Ser Pro Ala Gly Gly Asp Ala Thr Ser Leu 35 40 45 Ser Val Thr Thr Ser Ala Arg Ala Thr Pro Lys Gln Gln Arg Ser Val 50 55 60 Gln Arg Gly Ser Arg Arg Phe Pro Ser Val Val Val Cys 65 70 75 <210> 124 <211> 57 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 124 Met Ala Ser Ser Val Leu Ser Ser Ala Ala Val Ala Thr Arg Ser Asn 1 5 10 15 Val Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ala 20 25 30 Ala Ser Phe Pro Val Ser Arg Lys Gln Asn Leu Asp Ile Thr Ser Ile 35 40 45 Ala Ser Asn Gly Gly Arg Val Gln Cys 50 55 <210> 125 <211> 65 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 125 Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala 1 5 10 15 Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr 20 25 30 Arg Arg Thr Ser Ser Thr Ser Gly Thr Ser Gly Val Lys Cys Ser Ala 35 40 45 Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala 50 55 60 Ala 65 <210> 126 <211> 72 <212> PRT <213> Unknown <220> <223> chloroplast transit peptide <400> 126 Met Gly Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg 1 5 10 15 Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr 20 25 30 Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys 35 40 45 Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr 50 55 60 Asn Gly Ala Ser Ala Ala Ser Ser 65 70 <210> 127 <211> 20 <212> PRT <213> Unknown <220> <223> endosomal escape polypeptide <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is Lys, His or Arg <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa is Lys, His or Arg <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa is Lys, His or Arg <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa is Lys, His or Arg <220> <221> MISC_FEATURE <222> (19)..(19) <223> Xaa is Lys, His or Arg <400> 127 Gly Leu Phe Xaa Ala Leu Leu Xaa Leu Leu Xaa Ser Leu Trp Xaa Leu 1 5 10 15 Leu Leu Xaa Ala 20 <210> 128 <211> 20 <212> PRT <213> Unknown <220> <223> endosomal escape polypeptide <400> 128 Gly Leu Phe His Ala Leu Leu His Leu Leu His Ser Leu Trp His Leu 1 5 10 15 Leu Leu His Ala 20 <210> 129 <211> 9 <212> PRT <213> Unknown <220> <223> endosomal escape polypeptide <400> 129 His His His His His His His His His 1 5 <210> 130 <211> 7 <212> PRT <213> Betapolyomavirus macaca mulatta polyomavirus 1 <400> 130 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 131 <211> 16 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 131 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 132 <211> 9 <212> PRT <213> Homo sapiens <400> 132 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 133 <211> 11 <212> PRT <213> Homo sapiens <400> 133 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 134 <211> 38 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 134 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 135 <211> 42 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 135 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 136 <211> 8 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 136 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 137 <211> 8 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 137 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 138 <211> 8 <212> PRT <213> Homo sapiens <400> 138 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 139 <211> 12 <212> PRT <213> Mus musculus <400> 139 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 140 <211> 5 <212> PRT <213> Alphainfluenzavirus influenza A virus <400> 140 Asp Arg Leu Arg Arg 1 5 <210> 141 <211> 7 <212> PRT <213> Alphainfluenzavirus influenza A virus <400> 141 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 142 <211> 10 <212> PRT <213> Deltavirus hepatitis delta virus <400> 142 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 143 <211> 10 <212> PRT <213> Mus musculus <400> 143 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 144 <211> 20 <212> PRT <213> Homo sapiens <400> 144 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 145 <211> 17 <212> PRT <213> Homo sapiens <400> 145 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 146 <211> 8 <212> PRT <213> Orthobornavirus mammalian 1 orthobornavirus <400> 146 Pro Arg Pro Arg Lys Ile Pro Arg 1 5 <210> 147 <211> 9 <212> PRT <213> Hepacivirus hepacivirus C <400> 147 Pro Pro Arg Lys Lys Arg Thr Val Val 1 5 <210> 148 <211> 12 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 148 Asn Leu Ser Lys Lys Lys Lys Arg Lys Arg Glu Lys 1 5 10 <210> 149 <211> 10 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 149 Arg Arg Pro Ser Arg Pro Phe Arg Lys Pro 1 5 10 <210> 150 <211> 8 <212> PRT <213> Lymphocryptovirus human gammaherpesvirus 4 <400> 150 Lys Arg Pro Arg Ser Pro Ser Ser 1 5 <210> 151 <211> 19 <212> PRT <213> Alphainfluenzavirus influenza A virus <400> 151 Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg Gly Glu Asn Glu Arg 1 5 10 15 Lys Thr Arg <210> 152 <211> 11 <212> PRT <213> Homo sapiens <400> 152 Pro Arg Pro Pro Lys Met Ala Arg Tyr Asp Asn 1 5 10 <210> 153 <211> 8 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 153 Lys Arg Ser Phe Ser Lys Ala Phe 1 5 <210> 154 <211> 9 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 154 Lys Leu Lys Ile Lys Arg Pro Val Lys 1 5 <210> 155 <211> 19 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 155 Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala Lys Arg Val 1 5 10 15 Lys Leu Asp <210> 156 <211> 17 <212> PRT <213> Deltaretrovirus human T-lymphotropic virus 1 <400> 156 Pro Lys Thr Arg Arg Arg Pro Arg Arg Ser Gln Arg Lys Arg Pro Pro 1 5 10 15 Thr <210> 157 <211> 25 <212> PRT <213> Caenorhabditis elegans <400> 157 Met Ser Arg Arg Arg Lys Ala Asn Pro Thr Lys Leu Ser Glu Asn Ala 1 5 10 15 Lys Lys Leu Ala Lys Glu Val Glu Asn 20 25 <210> 158 <211> 16 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 158 Lys Thr Arg Arg Arg Pro Arg Arg Ser Gln Arg Lys Arg Pro Pro Thr 1 5 10 15 <210> 159 <211> 13 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 159 Arg Arg Lys Lys Arg Arg Pro Arg Arg Lys Lys Arg Arg 1 5 10 <210> 160 <211> 14 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 160 Pro Lys Lys Lys Ser Arg Lys Pro Lys Lys Lys Ser Arg Lys 1 5 10 <210> 161 <211> 17 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 161 His Lys Lys Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser 1 5 10 15 Lys <210> 162 <211> 18 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 162 Gln Arg Pro Gly Pro Tyr Asp Arg Pro Gln Arg Pro Gly Pro Tyr Asp 1 5 10 15 Arg Pro <210> 163 <211> 16 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 163 Leu Ser Pro Ser Leu Ser Pro Leu Leu Ser Pro Ser Leu Ser Pro Leu 1 5 10 15 <210> 164 <211> 18 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 164 Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His 1 5 10 15 Arg Lys <210> 165 <211> 14 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 165 Pro Lys Arg Gly Arg Gly Arg Pro Lys Arg Gly Arg Gly Arg 1 5 10 <210> 166 <211> 17 <212> PRT <213> Unknown <220> <223> nuclear localization signal <400> 166 Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys Lys Arg Lys 1 5 10 15 Val <210> 167 <211> 11 <212> PRT <213> Lentivirus Human immunodeficiency virus 1 <400> 167 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 168 <211> 8 <212> PRT <213> Lentivirus Human immunodeficiency virus 1 <400> 168 Arg Lys Lys Arg Arg Gln Arg Arg 1 5 <210> 169 <211> 11 <212> PRT <213> Lentivirus Human immunodeficiency virus 1 <400> 169 Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala 1 5 10 <210> 170 <211> 11 <212> PRT <213> Lentivirus Human immunodeficiency virus 1 <400> 170 Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg 1 5 10 <210> 171 <211> 11 <212> PRT <213> Lentivirus Human immunodeficiency virus 1 <400> 171 Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg 1 5 10 <210> 172 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> peptide transduction domain <220> <221> MISC_FEATURE <222> (4)..(50) <223> These individual amino acid residues may be present or absent <400> 172 Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg 20 25 30 Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg 50 <210> 173 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide transduction domain <400> 173 Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg 1 5 10 <210> 174 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> peptide transduction domain <400> 174 Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu 1 5 10 15 Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu 20 25 <210> 175 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> peptide transduction domain <400> 175 Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala 1 5 10 15 Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu 20 25 30 Ala <210> 176 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide transduction domain <400> 176 Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys 1 5 10 15 <210> 177 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 177 Gly Ser Gly Gly Ser 1 5 <210> 178 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 178 Gly Gly Ser Gly Gly Ser 1 5 <210> 179 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 179 Gly Gly Gly Ser 1 <210> 180 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 180 Gly Gly Ser Gly 1 <210> 181 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 181 Gly Gly Ser Gly Gly 1 5 <210> 182 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 182 Gly Ser Gly Ser Gly 1 5 <210> 183 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 183 Gly Ser Gly Gly Gly 1 5 <210> 184 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 184 Gly Gly Gly Ser Gly 1 5 <210> 185 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 185 Gly Ser Ser Ser Gly 1 5 <210> 186 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 186 Gly Pro Gly Pro 1 <210> 187 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 187 Pro Pro Ala Pro Pro Ala 1 5 <210> 188 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> linker polypeptide <400> 188 Pro Pro Pro Gly Pro Pro Pro 1 5 <210> 189 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> stem loop sequence <220> <221> misc_feature <222> (4)..(18) <223> n is any ribonucleotide <220> <221> misc_feature <222> (8)..(18) <223> These individual nucleotides may be absent <400> 189 uuunnnnnnn nnnnnnnnuu u 21 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> scaffold stem loop sequence <400> 190 ccagcgacta tgtcgtatgg 20 <210> 191 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> extended stem loop sequence <400> 191 gcgcttattt atcggagaga aatccgataa ataagaagc 39 <210> 192 <211> 465 <212> DNA <213> Alpharetrovirus Avian Leukosis virus <400> 192 atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60 ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120 agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180 agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240 ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300 ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360 cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420 ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctac 465 <210> 193 <211> 252 <212> DNA <213> Alpharetrovirus Avian Leukosis virus <400> 193 cactgcggca ccgctatcgg ctgcaactgc gccaccgcca gcgcgcctcc tcccccgtat 60 gtgggcagcg gcctctaccc ctccctggca ggagtgggag agcagcaggg ccagggcgga 120 gatacaccca gaggcgccga gcagcctaga gccgaacccg gccacgccgg ccaggcccct 180 ggccccgccc tgaccgactg ggccagaatc agagaggagc tggcctctac aggccctcca 240 gtggtcgcca tg 252 <210> 194 <211> 23 <212> RNA <213> Unknown <220> <223> Deltaproteobacter sp. <400> 194 ccgauaagua aaacgcauca aag 23 <210> 195 <211> 750 <212> DNA <213> Alpharetrovirus Avian Leukosis virus <400> 195 cctgtggtga tcaagaccga gggacctgcc tggacccctc tggaacctaa actgattaca 60 cggctggctg ataccgtcag aaccaagggc ctcagaagcc ccatcacaat ggccgaagtg 120 gaagccctga tgagcagccc actgctgcct cacgacgtga ccaacctgat gcgggtgatc 180 ctgggccccg ccccttacgc cctgtggatg gacgcctggg gcgtgcagct gcaaacagtt 240 atcgccgccg ccacaagaga cccccggcac ccagccaacg gccagggcag aggcgagaga 300 acaaacctgg atcggctgaa gggcctcgcc gatggcatgg ccggcaatcc tgagggccag 360 gctgctctgc tgagacccgg ggaactggtt gctatcaccg ccagcgccct gcaggccttc 420 agagaagtgg cccggctggc cgagcctaca gacccctggg ccgagatcac ccagggccct 480 tctgagagct tcgtggactt cgccaacaga ctgatcaagg ccgttgaggg ctccgacctg 540 cctcctagcg cccgcgcccc cgtgatcatc gactgtttta gacagaaatc gcaacccgac 600 atccagcagc tgatccgggc cgctccttct accctgacca cacctggcga gatcatcaag 660 tacgtgctgg acagacagaa gaccgccccc ctgaccgaca gaggaatcgc cgccgccatg 720 tctagcgcca ttcagcctct ggtgatggcc 750 <210> 196 <211> 264 <212> DNA <213> Alpharetrovirus Avian Leukosis virus <400> 196 gtggtcaaca gagaaagaga tggacagaca ggttctggcg gcagagcccg gggcctgtgc 60 tacacctgcg gatcccctgg acactaccag gcccagtgtc ctaagaaaag aaagtctggt 120 aacagcagag agcggtgcca gctgtgtgat ggcatgggcc acaacgccaa acagtgccgg 180 agacgggacg gaaaccaagg acaaagaccc ggccggggac tgagcagcgg accttggcct 240 gtcagccagc aacctgccgt gtcc 264 <210> 197 <211> 26 <212> RNA <213> Unknown <220> <223> Planctomycetes sp. <400> 197 ucuccgauaa auaagaagca ucaaag 26 <210> 198 <211> 384 <212> DNA <213> Alpharetrovirus Avian Leukosis virus <400> 198 ctggctatga ccatggaaca caaggaccgg cctctggtgc gggtgatcct gacaaatacc 60 ggctctcacc ccgtgaagca gcggtcagtg tacatcacag ccctgctgga cagcggcgct 120 gatatcacca tcattagcga ggaggactgg cctaccgact ggcccgtgat ggaagctgcc 180 aatccccaga tccacggcat cggaggcgga atcccgatga gaaagtccag agacatgatc 240 gaggtgggcg tgatcaaccg ggacggctct cttgagagac ctctgctgct gttccccgcc 300 gtggctatgg tgcgaggcag catcctgggc cgcgactgcc tgcagggcct gggcctgaga 360 ctgaccaacc tgaactttag ccag 384 <210> 199 <211> 465 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 199 atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60 ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120 agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180 cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240 ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300 ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360 agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420 cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttac 465 <210> 200 <211> 252 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 200 cactgcggca ccgccattgg atgtaactgc gctacagcca gcgccccccc ccctccctac 60 gtgggcagcg gactttatcc tagcctggcc ggcgtgggag agcagcaggg ccaaggcgga 120 gatacaccca gaggcgccga gcagcctaga gccgaacccg gccacgccgg actggcccct 180 ggcccagccc tgaccgactg ggcccgcatc cgggaagaac tggcttctac cggccccccg 240 gtggtcgcca tg 252 <210> 201 <211> 267 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 201 gccgtggtga acagagagag agacggccag acaggctccg gcggccgggc cagagagctg 60 tgctacacct gtggctctcc aggccactac caggctcagt gtcctaaaaa gcggaagtct 120 ggcaattcta gagagcggtg ccagctgtgc aacggcatgg gccataatgc caaacagtgt 180 cggaaacggg acggaaacca gggccagaga ccaggcagag gcctgtcttc tggcccctgg 240 cccggccctg agcctcctgc tgtgtcc 267 <210> 202 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> scaffold stem loop <400> 202 ccagcgacua ugucguagug g 21 <210> 203 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> stem loop sequence <220> <221> misc_feature <222> (4)..(28) <223> n is any ribonucleotide <220> <221> misc_feature <222> (8)..(28) <223> These individual nucleotides may be absent <400> 203 uuunnnnnnn nnnnnnnnnn nnnnnnnnuu u 31 <210> 204 <211> 19 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 204 acaugaggau uacccaugu 19 <210> 205 <211> 18 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 205 ugcaugucua agacagca 18 <210> 206 <211> 20 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 206 aauccauugc acuccggauu 20 <210> 207 <211> 12 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 207 ccucuucgga gg 12 <210> 208 <211> 21 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 208 aggaguuucu auggaaaccc u 21 <210> 209 <211> 30 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 209 aggugggacg accucucggu cguccuaucu 30 <210> 210 <211> 19 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 210 ugcucgcucc guucgagca 19 <210> 211 <211> 21 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 211 ugcucgacgc guccucgagc a 21 <210> 212 <211> 22 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 212 ugcucguuug cggcuacgag ca 22 <210> 213 <211> 17 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 213 agggagggag ggagagg 17 <210> 214 <211> 19 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 214 gguuaggguu aggguuagg 19 <210> 215 <211> 25 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 215 cugcucagua cgagaggaac cgcag 25 <210> 216 <211> 78 <212> RNA <213> Unknown <220> <223> exogenous stem loop region <400> 216 uacacuggga ucgcugaauu agagaucggc guccuuucau ucuauauacu uuggaguuuu 60 aaaaugucuc uaaguaca 78 <210> 217 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 217 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 His Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 218 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 218 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 219 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 219 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn His Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 220 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 220 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Ala 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser 225 230 235 240 Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val 245 250 255 Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys 260 265 270 Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp 305 310 315 320 Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 221 <211> 979 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 221 Arg Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys 100 105 110 Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe 115 120 125 Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln 130 135 140 Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu 165 170 175 Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His 195 200 205 Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly 210 215 220 Ala Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala 225 230 235 240 Ser Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val 245 250 255 Val Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly 260 265 270 Lys Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His 275 280 285 Thr Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg 290 295 300 Met Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp 305 310 315 320 Asp Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu 325 330 335 Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn 340 345 350 Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp 355 360 365 Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu 370 375 380 Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln 385 390 395 400 Leu Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp 405 410 415 Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu 420 425 430 Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp 435 440 445 Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser 450 455 460 Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg 465 470 475 480 Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro 485 490 495 Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser 500 505 510 Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys 515 520 525 Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg 530 535 540 Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr 545 550 555 560 Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe 565 570 575 Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys 580 585 590 Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr 595 600 605 Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr 610 615 620 Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr 625 630 635 640 Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn 645 650 655 Leu Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu 660 665 670 Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly 675 680 685 Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln 690 695 700 Arg Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly 705 710 715 720 Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met 725 730 735 Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp 740 745 750 Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly 755 760 765 Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp 770 775 780 Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser 785 790 795 800 Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe 805 810 815 Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys 820 825 830 Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val 835 840 845 Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val 850 855 860 Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn 865 870 875 880 Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser 885 890 895 Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val 900 905 910 Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu 915 920 925 Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys 930 935 940 Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val 945 950 955 960 Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys 965 970 975 Pro Ala Val <210> 222 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 222 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Gln Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 223 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 223 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Thr Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 224 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 224 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Arg Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 225 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 225 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Tyr Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 226 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 226 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 His Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 227 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 227 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Ala Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 228 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 228 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 229 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 229 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Arg Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys 100 105 110 Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe 115 120 125 Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln 130 135 140 Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu 165 170 175 Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His 195 200 205 Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser 225 230 235 240 Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val 245 250 255 Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys 260 265 270 Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp 305 310 315 320 Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 230 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 230 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Tyr Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 231 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 231 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Asn Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 232 <211> 979 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 232 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Trp Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser 785 790 795 800 Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe 805 810 815 Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys 820 825 830 Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val 835 840 845 Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val 850 855 860 Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn 865 870 875 880 Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser 885 890 895 Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val 900 905 910 Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu 915 920 925 Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys 930 935 940 Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val 945 950 955 960 Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys 965 970 975 Pro Ala Val <210> 233 <211> 979 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 233 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Tyr Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser 785 790 795 800 Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe 805 810 815 Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys 820 825 830 Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val 835 840 845 Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val 850 855 860 Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn 865 870 875 880 Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser 885 890 895 Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val 900 905 910 Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu 915 920 925 Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys 930 935 940 Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val 945 950 955 960 Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys 965 970 975 Pro Ala Val <210> 234 <211> 393 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 234 ctggctatga ccatggaaca caaggacaga cccctggtgc gggtgatcct gacaaacacc 60 ggaagccacc ccgtgaagca gcgctccgtg tacatcacag cccttctgga cagcggcgcc 120 gacatcacca tcatcagcga ggaagattgg cctacagact ggcctgtgat ggaagccgca 180 aacccccaga tccacggcat cggcggaggt atacccatgc ggaagagcag agacatgatc 240 gagctgggcg tgatcaaccg ggacggcagc ctggaacggc ccctgctgtt gtttcctgct 300 gtggctatgg tgcggggaag catcctgggc agagattgcc tgcagggcct gggcctgcgc 360 ctgaccaacc tgtgaggagg gccactgttc tca 393 <210> 235 <211> 270 <212> DNA <213> Betaretrovirus enzootic nasal tumor virus <400> 235 atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60 agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120 tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180 cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240 ttctggaccc tgatccgcga ctgcctggat 270 <210> 236 <211> 546 <212> DNA <213> Betaretrovirus enzootic nasal tumor virus <400> 236 ttcgacaatg acgagctgaa aagactgggc aacctgctca agcaggagga agatcctctg 60 cacgaccctg acagcgagaa cagctacgac gcccctcctc ctcctcatcc tagcctgcac 120 tctagcagac cttccgacaa cgacgacctg ctgtctagca cagacgaggc cgagctggac 180 gaggaagccg ccaagtacca ccaggaggac tggggcttcc tggctcagga gaaaggcgcc 240 ctgacaagca aggacgagct ggtggaatgt ttcaagaacc tgaccatcgc cctgcagaac 300 gctggaatca agctgccagc caacaacgat aagttcccct ccgccccccc tctgcctcct 360 gcctacgccc ctagcgtggt ggccggactg gatccacccc ccggccccct gcccccaagc 420 aagaacatgt ctccactgca gaaagccctg agacaagccc agaggctggg cgaagttgtg 480 tccgatttca gcctggcctt ccccgtgttc gagaacaaca accagcggta ctacgagagc 540 ctgcct 546 <210> 237 <211> 618 <212> DNA <213> Betaretrovirus enzootic nasal tumor virus <400> 237 ttcaagcagc tgaaggaact caaaatcgca tgcagccagt acggccctac cgcacctttt 60 accatcgcca tgatcgagaa cctcggcacc caggccctgc cacctaatga ttggaagcag 120 acagccagag cctgcctgtc aggcggagat tacctgctgt ggaagagcga gttcttcgag 180 caatgcgcca gaatcgctga cgtgaaccgg cagcagggca tccagacgag ctacgagatg 240 ctgatcggcg agggacccta ccaggccacc gacacccagc tgaacttcct gcctggggcc 300 tatgcccaaa tcagcaacgc cgccagacag gcttggaaga aactgcctag ctcttctaca 360 aagaccgagg acctgagcaa agtgcggcaa ggccccgatg agccctacca ggactttgtc 420 gccagactgc tcgacaccat cggcaagatc atgagcgacg aaaaggccgg catggtcctg 480 gctaagcaac tggctttcga gaatgctaat agcgcctgtc aggccgccct gcggccttac 540 agaaagaagg gcgacctgtc cgattttatc agaatctgcg ccgacatcgg cccctcttat 600 atgcagggaa ttgccatg 618 <210> 238 <211> 405 <212> DNA <213> Betaretrovirus enzootic nasal tumor virus <400> 238 gccgctgctc tgcagggcaa aagcatcaag gaagtgcttt tccagcagca agctcggaac 60 aagcggggaa gacagagaag cggcaatagc ggttgttttg tgtgcggcca gcccggccac 120 cgcgccgccg tgtgccccca gaagcagcag agccccgtga acacccctaa tctgtgcccg 180 cgctgtaaaa aaggaaagca ttgggcacga gattgccggt ccaaaacaga tgttcaaggt 240 acccctttac ccccggtgtc gggaaactgg gtgaggggcc agcccctggc cccgaaacaa 300 tgttatgggg caacactgca ggttccaaaa gaaccattgc agacctctgt cgagccacaa 360 gaggcagcgc gggattggac ctctgtgcca cctcctacac agtat 405 <210> 239 <211> 999 <212> DNA <213> Betaretrovirus enzootic nasal tumor virus <400> 239 aaaaggaaag cattgggcac gagattgccg gtccaaaaca gatgttcaag gtaccccttt 60 acccccggtg tcgggaaact gggtgagggg ccagcccctg gccccgaaac aatgttatgg 120 ggcaacactg caggttccaa aagaaccatt gcagacctct gtcgagccac aagaggcagc 180 gcgggattgg acctctgtgc cacctcctac acagtattaa ctcccgagat gggggtccaa 240 accctggcta caggcgtgtt cggtcctctg ccccccggca ccgccggcct gctgctgggc 300 agaagcagcg ccagcctgaa gggcatcctg atccatcctg gagtgattga cagcgactac 360 accggcgaga tcaagatcct ggcctctgcc cctaacaaga tcatcgtgat caacgccggc 420 caaagaatcg cccagctgct gctcgtgcct ctggtgatcc agggcaaaac catcaaccgg 480 gacaggcagg acaagggatt tggatcttct gacgcctatt gggtgcagaa cgtgaccgag 540 gccagacctg aactggaact tagaatcaat ggcaagctgt tccggggcgt gctggataca 600 ggcgccgaca tcagcgtgat cagcgacaaa tactggccca ccacctggcc taagcagatg 660 gctatctcta cactgcaggg catcggccag acaaccaacc ccgagcagag cagcagcctg 720 ctgacctgga aggacaagga cggccacacc ggccaattca agccctacat cctgcctcac 780 ctgcctgtga acctgtgggg cagagatatc ctgagcaaga tgggcgtcta cctgtactcc 840 cctagcccta ccgtgacaga tctgatgctg gaccagggcc tgctgcctaa tcagggcctc 900 ggaaagcaac accagggaat tatcctgcca ctggacctga aaagcaacca ggatagaaag 960 ggcctgggat gcttcccctg aggacctctg attctcctg 999 <210> 240 <211> 297 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 240 atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60 tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120 aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180 ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240 tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctg 297 <210> 241 <211> 288 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 241 ctgagcgccg aggccaagtc cgtgacagag gaagaactgg aagaaggcct gacaggactg 60 ctgagcgcca gcagccagga gaagacctac ggcacaagag gcaccgccta tgccgaaatc 120 gacaccgagg tggataagct gagcgagcac atctacgacg agccctacga ggagaaggaa 180 aaggccgaca agaacgagga gaaggaccac gtgcggaagg tcaagaagat cgtgcaaaga 240 aaggaaaata gcgagcataa gagaaaggag aaagatcaga aggccttc 288 <210> 242 <211> 222 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 242 ctggcaaccg actggaacaa cgacgacctg agccctgagg actgggacga cctggaagag 60 caggccgccc actaccacga tgacgacgaa ctgatcctgc ctgtgaagag aaaggtggac 120 aagaagaagc cgctcgccct gaggcggaaa cctctgcccc cggttggctt cgccggagcc 180 atggccgagg ctagagagaa gggcgatctg accttcacat tt 222 <210> 243 <211> 681 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 243 cccgtggttt tcatgggaga atccgacgac gatgataccc ctgtgtggga acctctgccc 60 ctgaagacac tgaaggaact gcagtctgcc gtgcggacca tgggccctag cgccccttac 120 accctccagg tggtggacat ggttgcctct cagtggctga cacctagcga ttggcaccaa 180 accgccagag ccaccctgtc tcctggggac tacgtgctgt ggcggaccga gtacgaggag 240 aagagcaagg aaaccgtgca gaagaccgct ggcaagcgga aaggcaaggt gagcctggat 300 atgctgctgg gcacaggtca gttcctgagc ccttcttctc agatcaagct ttctaaagat 360 gtgctgaagg atgtgaccac caacgccgtc ctggcctgga gagccatccc tcctccaggc 420 gtcaaaaaga cagtgctggc cggactcaag cagggaaatg aggaaagcta cgagacattc 480 atcagcagac tggaagaggc cgtgtacaga atgatgccta gaggagaagg cagcgacatc 540 ctgatcaagc agctggcttg ggagaacgct aattctctgt gccaggacct gatccggcct 600 atgcggaaga ccggcaccat gcaggactac atcagagcct gtctggatgc ctcccctgcc 660 gtggtgcagg gcatggccta c 681 <210> 244 <211> 723 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 244 gccgccgcaa tgagaggaca aaagtacagc accttcgtga aacagacata cggcggcgga 60 aaaggcggac agggctctga aggccctgtg tgcttcagct gcggcaaaac aggtcacatt 120 aagcgggatt gcaaggaaga gaaaggaagc aagcgcgctc ctcctggact gtgtcctaga 180 tgcaagaaag gctaccactg gaagagcgag tgcaagagca agttcgacaa ggacggcaac 240 cctctgccac cactggaaac taacgccgaa aacagcaaaa accccacaca gaaaggcgac 300 aaaggaaagg acagcggact gaaccccgaa gcccctcctt tcaccatcca cgacctgcca 360 cgaggcaccc caggcagtgc cggcttggac ctgagcagcc agaaagacct gatcctgtct 420 ctggaagacg gcgtgtccct ggtgccaacc ctggtgaagg gcaccctgcc cgagggcacc 480 acgggactga tcatcggcag atccagcaac tacaagaaag gcctggaggt gctgcccggc 540 gtgatcgact ccgacttcca gggcgaaatt aaggtcatgg taaaggccgc taagaacgcc 600 gtgatcatcc acaagggcga gcggatcgcg cagctgctgc tgctgcctta tctgaaactg 660 cctaacccta tcatcaagga ggaaagaggc agcgagggat ttggcagcac ctcccacgtg 720 cac 723 <210> 245 <211> 360 <212> DNA <213> Betaretrovirus mouse mammary tumor virus <400> 245 tgggtgcagg agatcagcga cagcagaccc atgctgcaca tcagcctgaa cggcagaaga 60 ttcctgggcc tgctggacac cggggccgat aagacctgca tcgccggcag agattggccc 120 gccaactggc ctattcacca gaccgagagc agcctgcagg gcttgggaat ggcttgtggc 180 gtggctagaa gctctcagcc tctgagatgg cagcacgagg ataagtctgg cattatccat 240 cctttcgtga tccccacatt gccttttacc ctctggggcc gggacatcat gaaagagata 300 aaggtgcggc tgatgaccga tagcccagac gacagccagg atctgacatc tctgtacggc 360 <210> 246 <211> 300 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 246 atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60 acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120 acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180 gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240 agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300 <210> 247 <211> 348 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 247 gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 60 accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 120 tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 180 ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 240 gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 300 agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatg 348 <210> 248 <211> 249 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 248 gccgtggtga accctaaaga ggaactgaaa gaaaagatcg cccagctgga agagcagatc 60 aaactggaag agctgcacca ggccctgatt tctaagctgc aaaagctgaa aaccggcaac 120 gagacagtca ctcaccctga tacagccgga ggcctgagca gaacaccaca ttggcccggc 180 cagcacatcc ctaagggcaa gtgctgcgcc agccgggaaa aggaagagca gatccccaag 240 gatatcttc 249 <210> 249 <211> 678 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 249 cctgtgaccg aaaccgttga cggacagggc caggcatgga gacaccacaa tggcttcgac 60 ttcgccgtga tcaaggaact gaagacagcc gcctctcaat acggcgccac cgcaccttac 120 accctggcta tcgtggaatc cgtcgccgac aactggctga ccccaaccga ctggaatacc 180 ctggtgcggg ccgtgctgtc tggcggcgac cacctgctct ggaagtctga gttcttcgag 240 aactgtaggg acaccgctaa gcggaaccag caggccggca atggatggga ttttgacatg 300 ctgaccggca gcggcaacta cagctctaca gacgcccaaa tgcagtacga ccctggcctg 360 ttcgcccaga ttcaggccgc tgccacaaag gcctggcgga agctgcccgt gaagggggat 420 cccggcgcca gcctgaccgg cgtgaagcag ggccccgatg agcctttcgc cgacttcgtg 480 catagactga tcaccacagc cggcagaatc ttcggctccg ccgaagccgg cgtggactac 540 gtgaagcagc tggcttacga gaacgccaac cctgcctgcc aggccgcaat cagaccctat 600 agaaagaaga cagatctgac cggctacatc cggctgtgca gcgacatcgg cccttcctat 660 cagcagggac tggctatg 678 <210> 250 <211> 694 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 250 gccgctgcct ttagcggcca gaccgtgaag gacttcctga acaacaagaa caaggaaaag 60 ggcggatgtt gttttaagtg cggcaagaaa ggacactttg ccaaaaactg ccacgagcac 120 gcccacaaca acgccgagcc caaggtgccc ggcctgtgtc ctcggtgcaa gagaggcaag 180 cactgggcca atgagtgcaa gtccaagaca gataaccagg gaaatccaat ccccccccat 240 cagggaaatg gtgcttctcc tagacctaga aacaagctga tgggccaaag cgccctgttc 300 cagcctacca agacaaccca cttcaaggcc taccagagcc accccagaaa gtgcagaatc 360 ggccctctgt tccacctgcc ccacagcatc aacgcctgaa atggggcccc aagcgttaag 420 cactggaata tatggaccac tgcctcccaa cacttttgga ttaatcctag gccgaagtag 480 cattactatg aagggtctac aagtttatcc aggagtaatt gataatgact ataccggaga 540 aattaaaatt atggcaaaag ctgttaacaa tattgttact gtctctcaag gcaacagaat 600 agctcaatta atcctcctgc ctctgatcga gacagacaat aaggtacaac aaccttatag 660 aggacaagga agttttggat cctcagacat atat 694 <210> 251 <211> 459 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 251 tgggtccagc ctatcacctg tcagaagcct tctctgaccc tgtggctgga cgacaagatg 60 ttcaccggcc tcatcgacac cggcgccgac gtgacaatca tcaagctgga agattggcct 120 ccaaattggc ccattacaga taccctgacc aacctgagag gcatcggaca gtccaacaac 180 cccaagcaga gcagcaagta cctgacatgg cgggacaagg agaacaacag cggcctgatc 240 aaaccttttg tgatccccaa tctgcctgtg aacctgtggg gaagagatct gctgtctcag 300 atgaagatca tgatgtgcag cccaaacgac atcgtgaccg cccagatgct ggctcaaggc 360 tacagccccg gcaaaggcct gggcaagaaa gagaatggaa tcctgcaccc tatccctaac 420 cagggccaga gcaacaagaa gggcttcggc aacttctga 459 <210> 252 <211> 300 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 252 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 <210> 253 <211> 348 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 253 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 60 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 120 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 180 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 240 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 300 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatg 348 <210> 254 <211> 249 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 254 gcggttgtta atccaaaaga ggagctcaaa gaaaaaattg ctcaattaga ggaacagatt 60 aaattagaag agttacacca ggcactaatt tccaaattac aaaaactaaa aacagggaat 120 gaaactgtaa ctcacccaga cacagcagga ggcctttctc gcacgcctca ctggccaggg 180 caacatatcc ctaaaggaaa atgttgcgcc agtcgagaaa aggaagaaca aatcccaaaa 240 gatattttc 249 <210> 255 <211> 678 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 255 ccagtgactg aaaccgttga tgggcaaggt caagcctgga gacaccataa tggttttgat 60 tttgccgtca taaaagaatt aaaaacagct gcttcccaat atggggctac tgccccatac 120 acattagcca tagtggaatc tgtagcggac aattggctta cccctacaga ttggaatacg 180 cttgttaggg cagtcctctc aggaggagat cacttactgt ggaaatctga gttttttgaa 240 aattgcagag atacggctaa aagaaaccaa caagccggta atggctggga ttttgacatg 300 ttaacaggtt cgggtaatta ttccagcacc gatgcacaaa tgcagtatga tccaggattg 360 tttgctcaaa ttcaagcggc tgctacaaaa gcctggagaa aacttcccgt taagggagac 420 ccaggagcct cccttacagg agtcaaacaa ggacccgatg agccatttgc agatttcgta 480 cacagactta taacaactgc tgggagaatc tttggaagtg ctgaggccgg tgtagactat 540 gtaaaacaac tagcatatga aaatgctaat ccagcttgtc aggcagccat tcgcccctat 600 agaaagaaga cagatttaac tggctatatc cgtctttgct cggatattgg gccctcttat 660 cagcaaggcc tggccatg 678 <210> 256 <211> 694 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 256 gccgccgcct ttagcgggca gactgtaaaa gattttctta acaacaaaaa taaagagaaa 60 ggagggtgtt gctttaaatg cggtaaaaaa ggacactttg caaaaaattg tcatgaacat 120 gcacataaca atgctgaacc aaaagttccc ggactctgcc ctagatgtaa aagagggaaa 180 cattgggcca atgaatgcaa atccaaaact gataatcaag gaaacccaat accaccccat 240 cagggaaacg gggccagccc caggccccga aacaagctta tggggcagtc agctttgttc 300 cagccaacaa aaacaaccca tttcaaagct taccagagcc accccaggaa gtgcaggatt 360 ggacctctgt tccacctccc acacagtatt aacgcctgaa atggggcccc aagcgttaag 420 cactggaata tatggaccac tgcctcccaa cacttttgga ttaatcctag gccgaagtag 480 cattactatg aagggtctac aagtttatcc aggagtaatt gataatgact ataccggaga 540 aattaaaatt atggcaaaag ctgttaacaa tattgttact gtctctcaag gcaacagaat 600 agctcaatta atcctcctgc ctctgatcga gacagacaat aaggtacaac aaccttatag 660 aggacaagga agttttggat cctcagacat atat 694 <210> 257 <211> 459 <212> DNA <213> Betaretrovirus Mason-Pfizer monkey virus <400> 257 tgggtccaac ctattacttg tcaaaaacct tccttaacat tatggttaga tgacaaaatg 60 ttcacaggct taatagatac gggggctgat gtcacaatta tcaagctgga ggactggcct 120 cctaattggc ctataacaga taccttaacc aatttaagag gaataggaca aagtaacaac 180 cctaaacaaa gttctaaata tcttacttgg agagataaag aaaacaattc tggtctcatc 240 aaaccgtttg ttattcctaa cttacctgtc aatctttggg gccgagattt actttctcaa 300 atgaaaatta tgatgtgtag ccccaatgac atagtaactg ctcaaatgtt agcccagggc 360 tacagcccag gaaaagggtt aggaaaaaag gaaaatggca ttctacatcc tatcccaaat 420 caaggacaat ctaacaaaaa aggttttgga aatttttaa 459 <210> 258 <211> 327 <212> DNA <213> Deltaretrovirus Bovine leukemia virus <400> 258 atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60 ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120 aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180 ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240 aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300 ccaccctacg accctccagc catcctg 327 <210> 259 <211> 639 <212> DNA <213> Deltaretrovirus Bovine leukemia virus <400> 259 cccatcatct ccgagggaaa caggaatagg cacagggcat gggcactgag ggagctgcag 60 gatatcaaga aggagatcga gaataaggcc cctggctctc aagtgtggat ccagacactg 120 cggctggcca tcctgcaggc agacccaacc cctgcagatc tggagcagct gtgccagtac 180 atcgccagcc ctgtggacca gaccgcccac atgacatccc tgaccgcagc aatcgcagca 240 gcagaggcag caacacccag cagagtgctg acccctaaga ccggcacact gacccagcag 300 tctgcccagc caaacgcagg cgatctgagg agccagtatc agaatctgtg gctgcaggcc 360 ggcaagatct ccctgctggt gctgcagctg cagccctggt ctaccatcgt gcagggacct 420 gcagagagct ccgtggagtt tgtgaaccgc ctgcagatct ccctggccga caacctgcca 480 gatggcgtgc tgcggaatcc cctgctgaca cctctggtca tgcagatgct gaccgagtct 540 gtgagcaagt tctgcagggg agaggccagc ggaaggggag gagccaagac agcaggactg 600 agaaccatcg gaccacctag gatgaagcag cctgccctg 639 <210> 260 <211> 291 <212> DNA <213> Deltaretrovirus Bovine leukemia virus <400> 260 ctggtgcaca ccccaggacc aaagatgcct ggaccacgcc agccagcacc taagaggcca 60 ccacctggac cttgctacag atgtctgaag gagggacact gggccaggga ctgcccaaca 120 aaggcaaccg gcccaccacc tggaccatgc cccatctgta aggacccaag ccactggaag 180 cgcgattgtc ccacactgaa gtccaagaat ctaatagagg ggggacttag cgccccccaa 240 accataacac ctataacaga ttctcttagt gaggccgaat tagaatgctt a 291 <210> 261 <211> 378 <212> DNA <213> Deltaretrovirus Bovine leukemia virus <400> 261 ctctctattc ctctggcccg gagccgccct agcgtggccg tgtacctgag cggcccttgg 60 ctgcaacctt ctcagaacca ggccctgatg ctggttgata caggcgccga gaacaccgtg 120 ctgcctcaga attggctggt gcgggactac cccagaatcc ctgccgctgt gctgggagcc 180 ggaggcgtgt cccggaacag atacaactgg ctgcagggcc ctcttacact ggctctgaaa 240 cctgaaggcc cattcatcac catcccaaag atcctggtcg acaccttcga caagtggcag 300 atcctgggca gagatgtgct gagcagactg caggccagca tcagcatccc cgaggaagtg 360 cggccccccg tggtgggc 378 <210> 262 <211> 40 <212> DNA <213> Deltaretrovirus Bovine leukemia virus <400> 262 aggtgcccca gccatcctgc ccatcatctc cggcggcagc 40 <210> 263 <211> 390 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 263 atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60 gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120 tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180 tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240 aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300 cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360 tacgtggagc ccaccgcccc tcaagtgctg 390 <210> 264 <211> 642 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 264 ccagtgatgc acccccacgg cgcccctcct aatcacagac cttggcagat gaaagacctg 60 caggccatca agcaggaagt gtcccaggcc gctcctggca gcccccaatt tatgcagacc 120 atcagactcg ccgttcagca gttcgacccc acagccaagg atctgcagga cctgctgcag 180 tacctgtgta gcagcctggt cgccagcctg caccatcagc aactggattc tctgatcagc 240 gaggccgaga caagaggcat caccggctac aaccctctgg ccggccccct gcgggtgcag 300 gcaaacaacc cccagcagca ggggctgcgg agagagtacc agcagctgtg gctggctgct 360 ttcgccgcac tgcctggaag cgccaaagat ccatcttggg cctctatcct gcagggcctg 420 gaagaacctt accacgcctt tgtggaaaga ctgaacatcg ccctggacaa cggcctgcct 480 gagggcaccc ctaaggaccc catcctgaga tctctggcct acagcaacgc caacaaggaa 540 tgtcagaagc tgctgcaagc cagaggccac accaacagcc ccctgggcga catgctgcgc 600 gcctgccaga cctggacccc taaggacaag accaaggtgc tg 642 <210> 265 <211> 314 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 265 gtggtgcagc ctaagaagcc tccccctaat cagccctgct tccggtgcgg caaggccgga 60 cactggagcc gggactgcac ccagcctcgg cctccaccgg gaccttgtcc tctgtgccaa 120 gaccccacac actggaagag agattgcccc cgcctaaagc ccactatccc agaaccagag 180 ccagaggaag atgccctcct attagacctc cccgctgaca ttccacaccc aaaaaactcc 240 ataggggggg aggtttaacc tctcctccta ccctgcagca ggtgttcctg aatcaagatc 300 ctgccagcat cctg 314 <210> 266 <211> 546 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 266 acctcccacc ccaaaacaat cgaggccctg ctggacaccg gcgctgatat gacagtgctg 60 ccaatcgccc tgttcagcag caacacccct ctgaaaaaca ccagcgtgct cggagccggc 120 ggacagaccc aggaccactt caagctgaca agcctgcctg tcctgatccg gctgcccttc 180 agaaccacac ctatcgtgct gaccagctgc ctggtggaca caaagaacaa ctgggccatc 240 atcggcaggg acgccctgca acagtgccag ggcgtgctgt acctgccaga ggccaagggc 300 ccccccgtta tcctgcctat ccaggcccct gccgtgctgg gcctggaaca cctgccaaga 360 cccccccaga tcagccaatt tcctctgaac cagaacgcca gcagaccatg taatacctgg 420 tccggcagac cttggcggca ggccatttct aaccccaccc ccggccagga gatcacccag 480 tacagccagc tgaagcggcc tatggaacct ggagattcta gcaccacctg cggccctctg 540 acactg 546 <210> 267 <211> 39 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 267 ggtgcccctc aagtgctgcc agtgatgcac ggcggcagc 39 <210> 268 <211> 390 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 268 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt 390 <210> 269 <211> 642 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 269 ccagtcatgc atccacatgg tgctcctcct aaccatcgcc catggcaaat gaaagaccta 60 caggccatta agcaagaagt ctcccaagca gcccctggga gcccccagtt tatgcagacc 120 atccggcttg cggtgcagca gtttgacccc actgccaaag acctccaaga cctcctgcag 180 tacctttgct cctccctcgt ggcttccctc catcaccagc agctagatag ccttatatca 240 gaggccgaaa cccgaggtat tacaggttat aacccattag ccggtcccct ccgtgtccaa 300 gccaacaatc cacaacaaca aggattaagg cgagaatacc agcaactctg gctcgccgcc 360 ttcgccgccc tgccggggag tgccaaagac ccttcctggg cctctatcct ccaaggcctg 420 gaggagcctt accacgcctt cgtagaacgc ctcaacatag ctcttgacaa tgggctgcca 480 gaaggcacgc ccaaagaccc catcttacgt tccttagcct actccaatgc aaacaaagaa 540 tgccaaaaat tactacaggc ccgaggacac actaatagcc ctctaggaga tatgttgcgg 600 gcttgtcaga cctggacccc caaagacaaa accaaagtgt ta 642 <210> 270 <211> 314 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 270 gttgtccagc ctaaaaaacc ccccccaaat cagccgtgct tccggtgcgg gaaagcaggc 60 cactggagtc gggactgcac tcagcctcgt cccccccccg ggccatgccc cctatgtcaa 120 gacccaactc actggaagcg agactgcccc cgcctaaagc ccactatccc agaaccagag 180 ccagaggaag atgccctcct attagacctc cccgctgaca ttccacaccc aaaaaactcc 240 ataggggggg aggtttaacc tcccccccca cattacagca agtctttctt aaccaagacc 300 cagcatctat tctg 314 <210> 271 <211> 606 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 271 ccagttatac cgttagatcc cgcccgtcgg cccgtaatta aagcccaggt tgacacccag 60 accagccacc caaagactat cgaagctcta ctagatacag gagcagacat gacagtcctt 120 ccgatagcct tgttctcaag taatactccc ctcaaaaata catccgtatt aggggcaggg 180 ggccaaaccc aagatcactt taagctcacc tcccttcctg tgctaatacg cctccctttc 240 cggacaacgc ctattgtttt aacatcttgc ctagttgata ccaaaaacaa ctgggccatc 300 ataggtcgcg atgccttaca acaatgccag ggcgtcctgt acctccctga ggcaaaaggg 360 ccgcctgtaa tcttgccaat acaggcgcca gccgtccttg gactagaaca cctcccaagg 420 cccccccaaa tcagccagtt ccctttaaac cagaacgcct ccaggccttg caacacttgg 480 tccggaaggc cctggaggca ggccatatcg aatcctacac cgggccagga aataacccag 540 tattcccagt taaaaaggcc aatggaacct ggcgattcat ccacgacctg cgggccacta 600 actctc 606 <210> 272 <211> 36 <212> DNA <213> Deltaretrovirus human T-lymphotropic virus <400> 272 gcccctcaag tgctgccagt gatgcacggc ggcagc 36 <210> 273 <211> 285 <212> DNA <213> Epsilonretrovirus Walleye dermal sarcoma virus <400> 273 atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60 accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120 aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180 gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240 cgggtgaaga tccaggccag aaagggagag accgcaaggc agatg 285 <210> 274 <211> 468 <212> DNA <213> Epsilonretrovirus Walleye dermal sarcoma virus <400> 274 accgcacaca caatcaagaa gctgatcgtg ggcacaatcg ataagaacaa gcagcagacc 60 gagatcctgc agaagacaga cgagagcgat gaggagatgg acaccacaaa taccatgctg 120 tttatcgccc gcaacaagag ggagaggatc gcacagcagc agcaggcaga tctggcagca 180 cagcagcagg tgctgctgct gcagagggag cagcagaggg agcagagaga gaaggatatc 240 aagaagcggg acgagaagaa gaagaagctg ctgcccgaca ccacacagaa ggtggagcag 300 accgatatcg gagaggccag ctcctctgac gcctccgccc agaagccaat ctctaccgac 360 aacaatcccg atctgaaggt ggacggcgtg ctgacaagaa gccagcacac cacagtgcct 420 tccaacatca ccatcaagaa ggatggcaca tccgtgcagt accagcac 468 <210> 275 <211> 618 <212> DNA <213> Epsilonretrovirus Walleye dermal sarcoma virus <400> 275 cccatcagga actatcctac cggcgagggc aatctgacag cccaggtgcg gaaccctttt 60 agaccactgg agctgcagca gctgaggaag gactgccccg ccctgcctga gggcatccca 120 cagctggccg agtggctgac ccagacaatg gccatctaca attgtgacga ggccgatgtg 180 gagcagctgg ccagagtgat cttcccaacc cctgtgaggc agatcgcagg cgtgatcaac 240 ggacacgcag cagcaaatac cgcagccaag atccagaact acgtgacagc atgcaggcag 300 cactatccag ccgtgtgcga ttggggcacc atccaggcct ttacatacaa gccccctcag 360 accgcccacg agtatgtgaa gcacgccgag atcatcttca agaacaatag cggactggag 420 tggcagcacg caaccgtgcc ttttatcaat atggtggtgc agggcctgcc acccaaggtg 480 acacggtccc tgatgtctgg caacccagat tggagcacca agacaatccc acagatcatc 540 cccctgatgc agcactacct gaatctgcag tccagacagg acgccaagat caagcagacc 600 cctctggtgc tgcagctg 618 <210> 276 <211> 381 <212> DNA <213> Epsilonretrovirus Walleye dermal sarcoma virus <400> 276 gccatgccag cccagacaat gaacggcaat aagggctacg tgggctccta tcctaccaac 60 gagccatact attctttcca gcagcagcag aggccagcac ccagagcccc tccaggcaac 120 gtgccttcca atacctgctt cttttgtaag cagccaggac actggaaggc agactgccct 180 aataagacaa ggaacctgcg caatatgggc aacatgggaa ggggaggaag aatgggagga 240 ccaccttacc ggagccagcc ttatccagcc tttatccagc caccccagaa tcaccagaac 300 cagtataatg gcaggatgga tcgctctcag ctgcaggcca gcgcccagga gtggctgcca 360 ggaacctacc ctgcacgaga c 381 <210> 277 <211> 429 <212> DNA <213> Epsilonretrovirus Walleye dermal sarcoma virus <400> 277 ccaatcgatt gcccctatga gaagagcggc acaaagacca cacaggacgt gatcaccaca 60 aagaatgccg agatcatggt gaccgtgaac cacacaaaga tcccaatgct ggtggatacc 120 ggcgcctgtc tgacagcaat cggaggagca gcaaccgtgg tgccagacct gaagctgacc 180 aacacagaga tcatcgcagt gggaatctct gccgagcccg tgcctcacgt gctggccaag 240 ccaaccaaga tccagatcga gaacacaaat atcgatatca gcccttggta caatccagac 300 cagaccttcc acatcctggg ccgcgacaca ctgtctaaga tgcgggccat cgtgagcttt 360 gagaagaacg gcgagatgac cgtgctgctg cctccaacat atcacaagca gctgtcctgt 420 cagaccaag 429 <210> 278 <211> 381 <212> DNA <213> Gammaretrovirus feline leukemia virus <400> 278 atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60 gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120 gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180 atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240 ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300 ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360 cctctgacca gctctctgta c 381 <210> 279 <211> 210 <212> DNA <213> Gammaretrovirus feline leukemia virus <400> 279 cctgtgctgc ctaagtccga tccccctaaa cctcctgttt tacctcccga ccctagcagc 60 ccactgatcg acctgctgac ggaagaacct cctccttatc ctggcggaca tggcccccca 120 ccttctggcc ctcggacccc aaccgcctcc cctatcgcct ctagactgag agagcggaga 180 gaaaaccccg ccgaagagtc ccaagccctg 210 <210> 280 <211> 744 <212> DNA <213> Gammaretrovirus feline leukemia virus <400> 280 cccctgagag agggccctaa caaccggcct cagtactggc ccttcagcgc cagcgatctg 60 tataactgga agtcccacaa tcctcctttc agccaggatc ctgtggccct gacaaacctg 120 atcgagtcta tcctggtgac tcaccagcca acctgggatg actgccagca gctgctgcag 180 gccctcctga ccggcgaaga gagacagaga gtgctgctgg aggccagaaa gcaggtgcct 240 ggagaggacg gcaggcctac ccagctgcct aatgtgatcg acgagacatt ccccctgacc 300 agaccaaatt gggacttcgc caccccagct ggcagagagc acctgcgcct gtaccggcag 360 cttctgctgg ccggactgag aggcgctgcc agaagaccaa ccaacctggc tcaggtgaag 420 caggtcgtgc agggcaaaga ggagacaccc gccgctttcc tggaacggct gaaggaggcc 480 tacagaatgt acacccctta cgaccccgaa gatccaggac aggccgccag cgtgatcctg 540 agcttcatct accagagcag ccctgacatc agaaacaagc tgcagcggct ggaaggcctg 600 cagggcttca cactgagcga cctgctcaag gaggccgaga agatctacaa caagcgggaa 660 acccctgagg aaagagaaga gagattgtgg cagcggcaag aggagcggga caaaaagcgg 720 cacaaggaaa tgaccaaggt gctg 744 <210> 281 <211> 171 <212> DNA <213> Gammaretrovirus feline leukemia virus <400> 281 gctaccgtgg tggcccagaa cagagataaa gacagagagg aatcgaagct gggcgaccag 60 agaaagatcc cccttggcaa ggaccaatgt gcctactgca aggaaaaagg ccactgggtg 120 agggactgtc ccaagagacc cagaaagaag cccgcaaaca gcacactgct g 171 <210> 282 <211> 375 <212> DNA <213> Gammaretrovirus feline leukemia virus <400> 282 aacctgggcg atcaggagag ccaaggccag gacccccctc ctgagcctag aatcaccctg 60 aagattggag gccagcctgt gacctttctg gtggacaccg gcgcccaaca ctctgtgctg 120 accagacctg atggccccct cagcgataga accgccctgg tccagggagc tacaggcagc 180 aagaactaca gatggaccac cgacagaagg gtgcagctgg ctactggcaa ggtgacacac 240 agctttctgt acgtgcccga gtgcccttac cccctcctgg gcagagatct gttgacaaag 300 ctgaaggccc aaatccactt caccggagag ggcgctaatg tggtgggccc caagggcctg 360 cctcttcagg tgctg 375 <210> 283 <211> 393 <212> DNA <213> Gammaretrovirus Maloney murine leukemia virus <400> 283 atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60 cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120 gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180 atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240 ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300 gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360 cctcggtcca ccccaccaag aagctccctg tat 393 <210> 284 <211> 252 <212> DNA <213> Gammaretrovirus Maloney murine leukemia virus <400> 284 cctgccctga caccatctct gggcgccaag ccaaagccac aggtgctgtc tgacagcgga 60 ggacctctga tcgacctgct gaccgaggat cctccaccct acagagatcc aaggcctcca 120 ccatccgaca gggatggaaa cggaggagag gcaacaccag caggagaggc ccctgaccca 180 tcccccatgg cctctagact gaggggcagg cgcgagcctc cagtggcaga tagcaccaca 240 tcccaggcat tc 252 <210> 285 <211> 789 <212> DNA <213> Gammaretrovirus Maloney murine leukemia virus <400> 285 ccactgaggg caggaggaaa tggccagctg cagtattggc ccttttctag ctccgacctg 60 tacaactgga agaacaataa cccatccttc tctgaggatc ccggcaagct gaccgccctg 120 atcgagagcg tgctgatcac ccaccagccc acatgggacg attgtcagca gctgctgggc 180 accctgctga caggcgagga gaagcagcgg gtgctgctgg aggcaaggaa ggccgtgaga 240 ggcgacgatg gcagacccac ccagctgcct aatgaggtgg acgcagcatt tccactggag 300 aggccagact gggattatac cacacaggcc ggcaggaacc acctggtgca ctacaggcag 360 ctgctgctgg ccggactgca gaatgcaggc aggtccccta ccaacctggc caaggtgaag 420 ggcatcacac agggccctaa tgagagccca tccgcctttc tggagcgcct gaaggaggcc 480 taccggagat atacccccta cgaccctgag gatccaggcc aggagacaaa cgtgtctatg 540 agcttcatct ggcagtctgc cccagacatc ggaaggaagc tggagcgcct ggaggacctg 600 aagaataaga ccctgggcga tctggtgcgg gaggcagaga agatcttcaa caagagagag 660 acacctgagg agagggagga gcggatcagg agggagaccg aggagaagga ggagcggaga 720 aggacagagg acgagcagaa ggagaaggag cgggatcgcc ggagacacag agagatgagc 780 aagctgctg 789 <210> 286 <211> 180 <212> DNA <213> Gammaretrovirus Maloney murine leukemia virus <400> 286 gccaccgtgg tgtccggaca gaagcaggac aggcagggag gagagaggcg ccggtctcag 60 ctggaccgcg atcagtgcgc ctactgtaag gagaagggcc actgggccaa ggattgcccc 120 aagaagccta gaggcccaag gggccctagg ccacagacca gcctgctgac actggacgat 180 <210> 287 <211> 378 <212> DNA <213> Gammaretrovirus Maloney murine leukemia virus <400> 287 acactggacg atcaaggagg acagggacag gagccacctc cagagcccag aatcaccctg 60 aaggtcggcg gccagcctgt gacctttctg gtggacacag gcgcccagca cagcgtgctg 120 acccagaatc ccggccctct gtctgataag agcgcctggg tgcagggagc aacaggcggc 180 aagcggtaca gatggaccac agaccggaag gtgcacctgg ccaccggcaa ggtgacacac 240 agctttctgc acgtgcccga ctgtccatac cccctgctgg gcagagatct gctgaccaag 300 ctgaaggcac agatccactt cgagggatcc ggagcacagg tcatgggacc aatgggacag 360 cctctgcagg tgctgaca 378 <210> 288 <211> 459 <212> DNA <213> Lentivirus Caprine Arthritis Encephalitis Virus <400> 288 atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60 gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120 ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180 aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240 acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300 atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360 atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420 agcgtgtttc caatcgtggt gcaggcagca ggaggccgg 459 <210> 289 <211> 636 <212> DNA <213> Lentivirus Caprine Arthritis Encephalitis Virus <400> 289 tcctggaagg ccgtggactc tgtgatgttc cagcagctgc agaccgtggc aatgcagcac 60 ggactggtga gcgaggattt tgagagacag ctggcctact atgccaccac atggacatcc 120 aaggacatcc tggaggtgct ggccatgatg cccggcaaca gagcccagaa ggagctgatc 180 cagggcaagc tgaatgagga ggccgagagg tggcggagaa acaatccacc tccaccagca 240 ggaggaggac tgaccgtgga tcagatcatg ggagtgggac agacaaacca ggcagcagca 300 caggcaaata tggaccaggc cagacagatc tgcctgcagt gggtcatcaa cgcactgagg 360 gccgtgagac acatggcaca caggcccggc aaccctatgc tggtgaagca gaagaccaat 420 gagccttacg aggacttcgc cgccagactg ctggaggcca tcgatgccga gccagtgaca 480 cagcccatca aggactacct gaagctgacc ctgagctata caaatgcctc cgccgactgc 540 cagaagcaga tggatagaac cctgggacag agggtgcagc aggcctccgt ggaggagaag 600 atgcaggcct gtagggatgt gggctctgag ggcttt 636 <210> 290 <211> 249 <212> DNA <213> Lentivirus Caprine Arthritis Encephalitis Virus <400> 290 aagatgcagc tgctggccca ggccctgagg cctggcaagg gcaagggaaa cggacagcca 60 cagcggtgct acaattgtgg caagccagga caccaggcaa ggcagtgcag gcagggcatc 120 atatgtcaca actgtggaaa gagaggacat atgcaaaaag aatgcagagg aaagagagac 180 ataaggggaa aacagcaggg aaacgggagg agggggatac gtgtggtgcc gtccgctcct 240 cctatggaa 249 <210> 291 <211> 477 <212> DNA <213> Lentivirus Caprine Arthritis Encephalitis Virus <400> 291 atgtcacaac tgtggaaaga gaggacatat gcaaaaagaa tgcagaggaa agagagacat 60 aaggggaaaa cagcagggaa acgggaggag ggggatacgt gtggtgccgt ccgctcctcc 120 tatggaataa caagcgcccc tccaatggtg caggtgcgga ttggatctca gcagcgcaac 180 ctgctgttcg acaccggcgc cgatagaacc atcgtccggt ggcacgaggg ctccggcaac 240 cccgccggca gaatcaaact gcaaggcatc ggcggaatcg tggaaggcga gaagtggaac 300 aacgtggagc tggaatacaa gggcgagaca agaaagggca ccatcgtggt gctgcctcag 360 agccctgtgg aggtgctggg acgggacaac atggcccggt tcggcatcaa gatcatcatg 420 gctaatctgg aggaaaaaag aatccccatc accaaggtga agttgaaaga gggatgt 477 <210> 292 <211> 39 <212> DNA <213> Lentivirus Caprine Arthritis Encephalitis Virus <400> 292 ggtgccgcag gaggccggtc ctggaaggcc ggcggcagc 39 <210> 293 <211> 372 <212> DNA <213> Lentivirus equine infectious anemia virus <400> 293 atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60 ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120 cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180 gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240 gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300 tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360 agcgaggagt at 372 <210> 294 <211> 690 <212> DNA <213> Lentivirus equine infectious anemia virus <400> 294 ccaatcatga tcgacggcgc cggcaaccgg aatttcagac cactgacccc cagaggctac 60 accacatggg tgaacacaat ccagaccaac ggcctgctga atgaggcctc ccagaatctg 120 ttcggcatcc tgagcgtgga ttgtacctcc gaggagatga atgcctttct ggacgtggtg 180 ccaggacagg caggacagaa gcagatcctg ctggacgcca tcgataagat cgccgacgat 240 tgggataacc ggcacccact gcccaatgca cctctggtgg caccacctca gggacctatc 300 ccaatgacag ccaggtttat caggggactg ggagtgccac gggagagaca gatggagccc 360 gccttcgacc agtttaggca gacctaccgc cagtggatca tcgaggccat gagcgagggc 420 atcaaagtga tgatcggcaa gccaaaggca cagaacatca ggcagggagc caaggagccc 480 tatcctgagt tcgtggatag actgctgtcc cagatcaagt ctgagggcca ccctcaggag 540 atctccaagt ttctgaccga cacactgacc atccagaacg ccaatgagga gtgccggaat 600 gccatgcggc acctgagacc agaggatacc ctggaggaga agatgtacgc ctgtagagac 660 atcggcacca caaagcagaa gatgatgctg 690 <210> 295 <211> 453 <212> DNA <213> Lentivirus equine infectious anemia virus <400> 295 ctggccaagg ccctgcagac aggcctggcc ggaccattca agggaggcgc cctgaagggc 60 ggccccctga aggccgccca gacctgctat aactgtggca agccaggaca cctgagctcc 120 cagtgcaggg caccaaaggt gtgcttcaag tgtaagcagc ctggccactt ttctaagcaa 180 tgcagaagtg ttccaaaaaa cgggaagcaa ggggctcaag ggaggcccca gaaacaaact 240 ttcccgatac aacagaagag tcagcacaac aaatctgttg tacaagagac tcctcagact 300 caaaatctgt acccagatct gagcgaaata aaaaaggaat acaatgtcaa ggagaaggat 360 caagtagagg atctcaacct ggacagtttg tgggagtaaa catataacct ggagaagcgc 420 cccaccacaa tcgtgctgat caacgacacc cct 453 <210> 296 <211> 243 <212> DNA <213> Lentivirus equine infectious anemia virus <400> 296 ctgaacgtgc tgctggacac aggagctgat acatctgtgc tcaccaccgc ccactacaac 60 cggctgaagt acagaggcag aaagtaccag ggcaccggca tcatcggcgt gggcggaaat 120 gtggaaacct tcagcacccc agtgaccatt aagaaaaagg gccggcacat caaaaccaga 180 atgctggtcg ccgacatccc tgtgacaatc ctgggcagag atatccttca ggacttaggt 240 gca 243 <210> 297 <211> 39 <212> DNA <213> Lentivirus equine infectious anemia virus <400> 297 ggtgccagcg aggagtatcc aatcatgatc ggcggcagc 39 <210> 298 <211> 405 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 298 atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60 ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120 ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180 ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240 acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300 aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360 accagccgcc caacagcacc accttccgga aggggcggca actac 405 <210> 299 <211> 690 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 299 cccgtgcagc aagtgggcgg caattatgtg cacctgcccc tgagccctag aaccctgaac 60 gcctgggtga agctggtgga ggagaagaag ttcggagcag aggtggtgcc aggatttcag 120 gccctgtccg agggctgcac accctacgac atcaaccaga tgctgaattg cgtgggagag 180 caccaggcag caatgcagat catccgggag atcatcaacg aggaggcagc agactgggat 240 ctgcagcacc ctcagccagg accactgcct gcaggacagc tgcgggagcc tagaggctct 300 gacatcgccg gcaccacaag caccgtggat gagcagatcc agtggatgta caggcagcag 360 aacccaatcc ccgtgggcaa tatctatcgg agatggatcc agctgggcct gcagaagtgc 420 gtgcggatgt ataacccaac caatatcctg gacgtgaagc agggcccaaa ggagcccttc 480 cagagctacg tggacagatt ctacaagtcc ctgagagccg agcagacaga tcccgccgtg 540 aagaactgga tgacccagac actgctgatc cagaacgcca atcccgattg caagctggtg 600 ctgaagggcc tgggcatgaa tcctaccctg gaggagatgc tgacagcatg tcagggagtg 660 ggaggacctg gacagaaggc aaggctgatg 690 <210> 300 <211> 426 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 300 gcagaggccc tgaaggaggc cctgaggcct gaccagctgc catttgccgc cgtgcagcag 60 aagggccaga ggaagaccat caagtgctgg aactgtggca aggagggaca ctctgccaag 120 cagtgcaggg caccaaggcg ccagggatgc tggaagtgtg gcaagacagg ccacgtgatg 180 gccaagtgtc ctgagaggca ggcaggcttc ctgggactgg gaccatgggg caagaagcca 240 agaaattttc ctatggccca gatgcctcag ggactgatcc caaccgcacc accagaggac 300 ccagcagtgg atctgctgaa gaactacatg aagatgggca ggaagcagcg cgagaatagg 360 gagcgccctt ataaggaggt gacagaggac ctgctgcacc tgaactctct ctttggagaa 420 gaccag 426 <210> 301 <211> 306 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 301 tctctttgga gaagaccagt agttacagcc tacatcgagg aacagcctgt ggaagtgctg 60 ctggatacag gagctgatga cagcatcgtg gccggcattg agctgggacc taactacacc 120 ccaaagatcg tgggcggcat cggcggattc atcaatacca aagagtacaa ggacgtgaag 180 atcaaagtgc tgggcaaggt gatcaagggc accatcatga ccggcgacac acccatcaac 240 atcttcggca gaaacctgct caccgccatg ggcatgtctc tgaacctgcc tatcgccaag 300 gtcgag 306 <210> 302 <211> 39 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 302 ggtgccggcg gcaactaccc cgtgcagcaa ggcggcagc 39 <210> 303 <211> 405 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 303 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attac 405 <210> 304 <211> 690 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 304 ccagtgcagc aagtaggtgg caattatgtc cacctaccct taagtccaag aacattaaat 60 gcttgggtaa aattagtaga agagaaaaaa tttggggcag aggtagtgcc aggatttcaa 120 gcgctatcag aaggctgcac tccctatgat attaatcaaa tgctaaattg tgtaggagaa 180 catcaggcag ccatgcaaat tattagagag attataaatg aagaagctgc cgattgggat 240 ttacaacacc cgcaaccagg tccactacca gcagggcaac ttagagagcc aagaggatca 300 gacattgcag gaactactag tacagtagat gaacaaatcc aatggatgta caggcaacaa 360 aaccccatac cagtaggcaa catttataga aggtggatcc aattagggct gcagaaatgt 420 gtaagaatgt ataacccaac aaacatttta gatgtgaaac aaggaccaaa agagccattt 480 caaagctacg tagatagatt ctacaaaagt ctaagagcag agcaaacaga tcccgcagta 540 aagaattgga tgacccaaac actgctgatt caaaatgcta acccagattg taaactagtg 600 ctcaagggtc tgggcatgaa tcccacttta gaagaaatgc tgacagcctg tcagggagta 660 ggagggccag gacaaaaagc taggttaatg 690 <210> 305 <211> 426 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 305 gcagaagcat tgaaagaggc actgaggcca gatcaactcc catttgcagc agtccaacag 60 aaaggacaaa ggaagacaat caagtgttgg aattgtggaa aggagggaca ctctgcaaaa 120 caatgcaggg cccctagaag acagggctgc tggaagtgtg gaaaaacggg tcatgttatg 180 gccaaatgcc ctgaaagaca ggcgggtttt ttagggcttg gcccatgggg aaagaagccc 240 cgcaatttcc ccatggccca gatgcctcag gggctgatac caactgctcc cccagaggat 300 ccagctgtgg atctactgaa gaattacatg aagatgggca gaaagcagag ggagaacaga 360 gagagacctt acaaggaggt gacagaggat ttgctgcacc tcaattctct ctttggagaa 420 gaccag 426 <210> 306 <211> 288 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 306 tctctttgga gaagaccagt agtcactgcc tacattgaag aacagcccgt agaagtatta 60 ttagatacag gggctgacga ttcaattgta gcagggatag aattgggtcc aaattatacc 120 cctaaaatag taggaggaat aggaggcttc attaacacca aagaatataa agatgtaaaa 180 ataaaagtct taggcaaggt aattaaggga acaattatga cgggagatac cccaattaat 240 atttttggca gaaatttgct aacagctatg ggcatgtctt taaatctc 288 <210> 307 <211> 57 <212> DNA <213> Lentivirus Simian immunodeficiency virus <400> 307 cccatagcta aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagc 57 <210> 308 <211> 429 <212> DNA <213> Lentivirus visna maedi virus <400> 308 atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60 gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120 tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180 acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240 agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300 aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360 aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420 gaggtgtat 429 <210> 309 <211> 660 <212> DNA <213> Lentivirus visna maedi virus <400> 309 ccaatcgtga atctgcaggc aggaggccgc agctggaagg cagtggagtc cgtggtgttc 60 cagcagctgc agaccgtggc catgcagcac ggcctggtgt ctgaggactt tgagcggcag 120 ctggcctact atgccaccac atggacaagc aaggatatcc tggaggtgct ggccatgatg 180 ccaggcaaca gagcccagaa ggagctgatc cagggcaagc tgaatgagga ggcagagcgg 240 tgggtgagac agaacccacc tggacccaat gtgctgaccg tggaccagat catgggcgtg 300 ggccagacaa accagcaggc cagccaggcc aatatggatc aggccaggca gatctgcctg 360 cagtgggtca tcaccgccct gaggagcgtg cgccacatgt cccacaggcc tggaaaccca 420 atgctggtga agcagaagaa tacagagtcc tacgaggact tcatcgccag gctgctggag 480 gcaatcgacg cagagcccgt gacagatcct atcaagacct acctgaaggt gaccctgtct 540 tatacaaacg ccagcaccga ctgccagaag cagatggata ggaccctggg aacacgcgtg 600 cagcaggcaa ccgtggagga gaagatgcag gcctgtcggg atgtgggctc tgagggcttt 660 <210> 310 <211> 237 <212> DNA <213> Lentivirus visna maedi virus <400> 310 aagatgcagc tgctggccca ggccctgaga cctcagggca aggcaggaca gaagggagtg 60 aaccagaagt gctacaattg tggcaagcca ggacacctgg caaggcagtg cagacaggga 120 atcatctgcc accactgtgg caagaggggc cacatgcaga aggactgtcg ccagaagaag 180 cagcagggca acaataggag aggaccaagg gtggtgccat ctgccccacc aatgctg 237 <210> 311 <211> 312 <212> DNA <213> Lentivirus visna maedi virus <400> 311 gtgacagagg cccctcctaa gatcgagatc aaggtgggca caagatggaa gaaactgctg 60 gtcgacaccg gcgctgataa gaccatcgtg accagccacg acatgagcgg catccccaag 120 ggcagaatca tcctgcaggg cattggagga atcatcgagg gcgagaagtg ggagcaggtg 180 cacctgcagt acaaggacaa gatcatccgg ggcaccatcg tggtgctcgc cacatctcca 240 gtggaagtgc tgggaagaga taacatgcgg gaactgggca tcggcctgat catggctaac 300 ctggaagaga aa 312 <210> 312 <211> 39 <212> DNA <213> Lentivirus visna maedi virus <400> 312 ggtgccaggg aggtgtatcc aatcgtgaat ggcggcagc 39 <210> 313 <211> 1632 <212> DNA <213> Bovispumavirus bovine foamy virus <400> 313 atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60 ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120 agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180 cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240 tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300 tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360 ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420 atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480 cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540 ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600 cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660 gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720 gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780 ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840 ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900 ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960 tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020 ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080 gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140 cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200 aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260 gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320 aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380 cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440 aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500 tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560 gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620 gggcaatcat ct 1632 <210> 314 <211> 438 <212> DNA <213> Bovispumavirus bovine foamy virus <400> 314 atgccggcac tccgcccact tcaagtggaa atcaagggca atcatcttaa aggctactgg 60 gacagcggcg ccgagatcac atgcgtgccc gctatctaca tcatcgagga acaacctgtt 120 ggcaagaagc tgattacaac catccacaac gagaaggaac atgatgtgta ctacgtggaa 180 atgaaaatcg agaagcggaa ggtgcagtgt gaagtgatcg ccaccgccct ggattacgtg 240 ctggtggccc ctgtggacat cccctggtat aagcctggac ctctggaact gaccatcaag 300 atcgacgtcg agagccagaa gcacaccctg atcacagagt ccaccctctc tccacagggc 360 cagatgagac tgaagaaact gctggaccag taccaggccc tgtggcagtg ctgggagaac 420 caggtgggcc acagaaga 438 <210> 315 <211> 39 <212> DNA <213> Bovispumavirus bovine foamy virus <400> 315 ggtgcctctg ctgtgcacag cgtgcggctg ggcggcagc 39 <210> 316 <211> 1929 <212> DNA <213> Prosimiispumavirus Brown greater galago prosimian foamy virus <400> 316 atgtctcagc cctcggcttc cggttcagct ggcgctggtg gagctcctca gcagccccct 60 ccaccgccac ctcagcccgg cccagcggct ccagtgccac gagcacaaat tggttatggt 120 gacctggacg tacttttatt acaacaggaa tatcatttga tagatccaaa tttacaggta 180 caacacttag acactttatt agttagaatc acaggaggca actggggacc aggtgaccga 240 tttgctcgta ttgaggttct tcttagggac accctaggac cactccaaca acccaggtat 300 aggtatgcag caatgcagca agcagatctc aggaatgaca tcatcctgca tctaaattat 360 caagatgcaa ttataatttt tgatatgata ataccatctg aaggagttca taggcatgga 420 cccatgttcg atggactttg gattcatgga gatgattact ccatgaactt tcagccaatt 480 acagcacatg aactgtatct tttgccacag caagttctca cagaagaagt ggaactgctg 540 acggaagtgt gcaaccgaat ggcagactgg ataagacggc atcgctgtgg aggaggaagt 600 ggaagctcac aacccccgcc gccgcctcca cccgctgtgc ctgtcttgcc ttcagcacct 660 ccggctagca gtttaccctt accaccacaa ggatggggaa tctccccacc agtagccaca 720 tccactccag gagcggcagg acatagctcc agtgccggcc ctaatatttc ccttggtgga 780 acatatgttc ctccaccggt agcaccacca gctccggtga tagggggacc cggaggtccc 840 ggacagttgc cagcaatggt gcaagtcctc cccgctcagc cagtagtaat tcccatcaat 900 gttatccgaa gtgtttgtgg agatactcca tcaaacccac aggatattcc attgtggatg 960 ggaagaatta ttccagccat tgagggtgtg tttcctattg ataatccaaa tctacgaatg 1020 agagttgtga atgccctgct tgccctacat ccgggcttag caataacaga acttaatgcc 1080 cagacttggg gacaagtctt ggctgtgctc catatgcgag ccttgggaca cacagccctc 1140 catcagcttc ctgcactctt ggagactatt gtcaagacag atggcatatt gccagcatat 1200 aatatgggta tggaagtaac tcaacaagac ttttcatacg tatggggaat tttaagaaca 1260 ctacttccgg gacaagcatt tgtcctaagt atgcaaaatg aattagatag attacctgcg 1320 gctcagagac cgggaatgtt tcccggccta ctgcagagga ctctggacat actagggtta 1380 aattctcggg gacaaaatat tcaaaaaacc aatactcagc aacaagctcc aaaaaggggt 1440 cagaaaccga aacctcgact tcctcctgtg cataggcgac ccgcaccatt tacaccacct 1500 gctaccccta gcccgcgaca acaagcttct gcttcccctt cttcgcaggg cgataaccga 1560 agtcctcaac cccaagggcg tggtacttac ggaccgtcca gaggaggagg cagtgggccc 1620 agatataact tcaggccccg agtgcaacca cctgatcgat acggctttgg aaggggacaa 1680 gggggtcgca gttcaatagg tgctcaagat aatcaacagc ctggtcaagg aggacaacgc 1740 actcaacaaa caaaccaaaa ccgaaaccaa ggcaacgcca cgggaggaag aactcaacct 1800 caaaatcgca ctgtgaatac tgtgcgtgtc acacagacta acccccaagg aggaagttca 1860 gtgtcaaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920 tcatcatct 1929 <210> 317 <211> 429 <212> DNA <213> Prosimiispumavirus Brown greater galago prosimian foamy virus <400> 317 caacttctca gaatacagga acaggaagtg caactcagag ctcatcatct taaaggcttt 60 gtggacacag gcagcagcat cacctgcttc cccaagtaca ccctggtcga ggaagatcct 120 atcggccagt acgacatcag caccatccac ggcacagtgt cccagcctgt gtactacatc 180 aagttcaagg tgaacggcaa gaaagtggaa gccgaggtga ccgagtctcc actggactac 240 gtgatcctgt gtcctagcga cgtgccctgg ctgtctacaa agctggaact gacaattaag 300 ctgcctctgc accagcagca acaggagctg ctgagcaaga ccagagtgaa tcaaaaacag 360 ctgcagaaac tctttatcca gtatgatgac ctgtggcaga agtgggagaa ccaggttgga 420 caccggaag 429 <210> 318 <211> 39 <212> DNA <213> Prosimiispumavirus Brown greater galago prosimian foamy virus <400> 318 ggtgccagaa cagtgaacac cgtgcgggtg ggcggcagc 39 <210> 319 <211> 1944 <212> DNA <213> Betacarmovirus Cardamine chlorotic fleck virus <400> 319 atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60 ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120 accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180 gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240 cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300 gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360 gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420 gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480 ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540 atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600 agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660 cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720 tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780 gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840 gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900 gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960 ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020 gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080 ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140 cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200 caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260 ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320 cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380 aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440 acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500 cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560 ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620 ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680 accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740 gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800 ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860 aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920 gcttccagcg gagatcaaag gaac 1944 <210> 320 <211> 447 <212> DNA <213> Betacarmovirus Cardamine chlorotic fleck virus <400> 320 atgaatcctc ttcagctgtt gcaaccgctt ccagcggaga tcaaaggaac taaactgtta 60 gcccattggg acagcggcgc caccattaca tgcgtgcccg agtccttcct ggaagatgag 120 cagcctatca aacagaccct gatcaagaca atccacggcg agaagcagca gaaagtgtac 180 tacctgacct ttaagatcaa gggaagaaag gtggaagctg aagtgatcgc cagcccttac 240 gagtacatcc tgctgtctcc aacagacgtg ccttggctga cacagcaacc tctgcagctg 300 accatcctgg tccccctgca ggagtatcag gatagaatcc tcaacaagac cgccctgcct 360 gaggaacaga agcaaagact gaagaccctg ttcgccaagt acgacaccct gtggcagcac 420 tgggagaacc aggtgggcca ccggcgg 447 <210> 321 <211> 39 <212> DNA <213> Betacarmovirus Cardamine chlorotic fleck virus <400> 321 ggtgccagag ccgtcaacac agtgacccag ggcggcagc 39 <210> 322 <211> 1677 <212> DNA <213> Equispumavirus equine foamy virus <400> 322 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagcct 1677 <210> 323 <211> 438 <212> DNA <213> Equispumavirus equine foamy virus <400> 323 atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa gggattttat 60 gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga agagcctatc 120 ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta ctacctgacc 180 tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct ggactacgtg 240 atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact gacaattaaa 300 atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc tagcgaggga 360 aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa gtgggaaaac 420 caggtcggcc acagaaga 438 <210> 324 <211> 48 <212> DNA <213> Equispumavirus equine foamy virus <400> 324 ggtgccaaca ccgtgcacac cgtgcggcaa gtggaatctg gcggcagc 48 <210> 325 <211> 1542 <212> DNA <213> Felispumavirus feline foamy virus <400> 325 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500 tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag at 1542 <210> 326 <211> 438 <212> DNA <213> Felispumavirus feline foamy virus <400> 326 atggatctgc tgaagccgtt gacggtggaa agaaaggggg taaagattaa aggttactgg 60 gattctcagg ccgacatcac ctgcgtgcca aaggacctgc tgcagggcga ggaacccgtg 120 cggcagcaga atgtgaccac catccacggc acccaggagg gcgatgtcta ctacgtgaac 180 ctgaagatcg acggcagaag aatcaacacc gaggtgatcg gcacaacact ggactatgct 240 atcatcaccc ctggcgacgt gccttggatc ctgaagaaac ctctggaact gacaattaag 300 ctggatctgg aagagcaaca aggaaccctg ctcaacaaca gcatcctgag caagaagggc 360 aaggaagagc tgaaacagct gttcgagaag tactccgccc tgtggcagag ctgggagaac 420 caggtgggac acagacgg 438 <210> 327 <211> 39 <212> DNA <213> Felispumavirus feline foamy virus <400> 327 ggtgccgccg ccgtgcacac cgtgaaagcc ggcggcagc 39 <210> 328 <211> 1941 <212> DNA <213> Simiispumavirus Rhesus macaque simian foamy virus <400> 328 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa c 1941 <210> 329 <211> 447 <212> DNA <213> Simiispumavirus Rhesus macaque simian foamy virus <400> 329 atggatcctc tccagctcct ccagcctctg gaagcggaaa tcaagggaac taaattaaaa 60 gcccactggg acagcggagc caccattaca tgcatccccg aggcttttct ggaagatgag 120 cagcctatcc aaacaatgct gatcaagacc atccacggcg agaagcagca gaacgtgtac 180 tacctgacat tcaagatcca gggcagaaag gtggaagccg aggtgctggc ctctccttat 240 gactacatcc tgctcaatcc ttctgatgtg ccatggctga tgaaaaagcc tctgcaactg 300 accgtgctgg tccccctgca ggactaccag gagcggctgc tgaaacagac caccctgcct 360 aaggaacaga aggaccagct ggaaaagctg ttcctgaagt acgacgccct gtggcagcac 420 tgggagaacc aggtgggcca cagaaga 447 <210> 330 <211> 39 <212> DNA <213> Simiispumavirus Rhesus macaque simian foamy virus <400> 330 ggtgccagaa cagtgaacac cgtgacaacc ggcggcagc 39 <210> 331 <211> 1941 <212> DNA <213> Spumavirus Simian foamy virus <400> 331 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa c 1941 <210> 332 <211> 447 <212> DNA <213> Spumavirus Simian foamy virus <400> 332 atggatcctc tacaactcct ccagcctctg gaagcggaaa tcaagggaac taaattaaaa 60 gcccactggg atagcggagc tacaatcacc tgcgtgcccg aggcctttct ggaagatgag 120 agacctatcc agaccatgct gatcaagacc atccacggcg agaagcagca ggacgtctac 180 tacctgacct tcaaggtgca gggcagaaag gtggaagccg aggtgctggc ctctccttat 240 gactacatcc tgctcaaccc cagcgacgtg ccttggctga tgaaaaagcc tctgcagctg 300 acagtgctgg tgccactgca cgagtaccag gagcggctgc tgcaacaaac cgccctgcct 360 aaggaacaga aagagctgct gcagaagctg ttcctgaagt acgacgccct gtggcagcat 420 tgggaaaacc aggtgggcca ccggaga 447 <210> 333 <211> 39 <212> DNA <213> Spumavirus Simian foamy virus <400> 333 ggtgccagat ccgtgaacac cgtgacagcc ggcggcagc 39 <210> 334 <211> 396 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 334 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattac 396 <210> 335 <211> 693 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 335 cctatagtgc agaacatcca ggggcaaatg gtacatcagg ccatatcacc tagaacttta 60 aatgcatggg taaaagtagt agaagagaag gctttcagcc cagaagtgat acccatgttt 120 tcagcattat cagaaggagc caccccacaa gatttaaaca ccatgctaaa cacagtgggg 180 ggacatcaag cagccatgca aatgttaaaa gagaccatca atgaggaagc tgcagaatgg 240 gatagagtgc atccagtgca tgcagggcct attgcaccag gccagatgag agaaccaagg 300 ggaagtgaca tagcaggaac tactagtacc cttcaggaac aaataggatg gatgacacat 360 aatccaccta tcccagtagg agaaatctat aaaagatgga taatcctggg attaaataaa 420 atagtaagaa tgtatagccc taccagcatt ctggacataa gacaaggacc aaaggaaccc 480 tttagagact atgtagaccg attctataaa actctaagag ccgagcaagc ttcacaagag 540 gtaaaaaatt ggatgacaga aaccttgttg gtccaaaatg cgaacccaga ttgtaagact 600 attttaaaag cattgggacc aggagcgaca ctagaagaaa tgatgacagc atgtcaggga 660 gtggggggac ccggccataa agcaagagtt ttg 693 <210> 336 <211> 42 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 336 gctgaagcaa tgagccaagt aacaaatcca gctaccataa tg 42 <210> 337 <211> 164 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 337 atacagaaag gcaattttag gaaccaaaga aagactgtta agtgtttcaa ttgtggcaaa 60 gaagggcaca tagccaaaaa ttgcagggcc cctaggaaaa agggctgttg gaaatgtgga 120 aaggaaggac accaaatgaa agattgtact gagagacagg ctaa 164 <210> 338 <211> 204 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 338 tttttaggga agatctggcc ttcccacaag ggaaggccag ggaattttct tcagagcaga 60 ccagagccaa cagccccacc agaagagagc ttcaggtttg gggaagagac aacaactccc 120 tctcagaagc aggagccgat agacaaggaa ctgtatcctt tagcttccct cagatcactc 180 tttggcagcg acccctcgtc acaa 204 <210> 339 <211> 297 <212> DNA <213> Lentivirus human immunodeficiency virus <400> 339 cctcagatca ctctttggca gcgacccctc gtcacaataa agataggggg gcaattaaag 60 gaagctctat tagatacagg agcagatgat acagtattag aagaaatgaa tttgccagga 120 agatggaaac caaaaatgat agggggaatt ggaggtttta tcaaagtaag acagtatgat 180 cagatactca tagaaatctg cggacataaa gctataggta cagtattagt aggacctaca 240 cctgtcaaca taattggaag aaatctgttg actcagattg gctgcacttt aaatttt 297 <210> 340 <211> 3123 <212> DNA <213> Artificial Sequence <220> <223> CasX 119 variant <400> 340 atggctccga agaagaagcg aaaggtcagc caggaaatta aacgcatcaa caagatccgc 60 cgtcgtctgg taaaagacag caatacgaaa aaagccggaa aaaccggtcc gatgaaaacg 120 ctgctggtgc gcgtgatgac gccggatctc cgcgaacgtc ttgagaattt gcgtaagaaa 180 cctgaaaata ttccgcaacc gatttctaac acctcgcgcg ccaatctgaa taaactgctg 240 accgattaca ccgaaatgaa gaaagcgatt ctgcacgttt actgggaaga gttccagaaa 300 gacccggtcg gtctgatgag ccgcgttgcg caacctgcgc cgaaaaatat cgatcagcgc 360 aagttaatcc cggttaaaga tggtaatgaa cgtttaacct ccagcggctt tgcctgcagt 420 cagtgctgcc agccacttta tgtttataaa cttgaacagg ttaacgataa agggaaaccc 480 cataccaatt atttcggccg ctgcaatgtc agcgaacatg aacgcctgat tttgttaagc 540 ccgcataaac cggaagcgaa tgacgaactg gtgacctatt ccctgggtaa atttggtcag 600 cgggcgctgg atttttacag cattcatgtg acgcgggaaa gtaaccatcc ggtaaagcca 660 ctggaacaaa tcggcggtaa cagctgcgcc tctggcccgg ttggcaaagc gcttagcgat 720 gcctgtatgg gcgcggtggc gagctttctg acaaaatacc aggatattat cctggagcat 780 cagaaggtga tcaaaaagaa cgagaaacgt ctggcaaatt taaaggatat tgcctccgct 840 aacggcctgg cgttcccgaa gattacctta ccgccgcagc cgcacaccaa agaaggtatc 900 gaagcgtata acaacgttgt tgcccagatc gtcatctggg tgaatctcaa cctgtggcaa 960 aaactgaaaa ttggtcgtga tgaagcaaaa ccgttgcagc gactgaaagg attcccgtcg 1020 tttccgctgg ttgaacgaca ggcgaacgaa gtggattggt gggatatggt ttgtaacgtc 1080 aaaaaattga tcaacgaaaa aaaggaagat ggcaaagttt tctggcaaaa tctggcgggt 1140 tacaaacgtc aggaggcgtt gcgtccgtat ctctcttcag aagaagatcg caaaaaaggc 1200 aagaagtttg ctcgctatca gtttggcgat ttattactgc atctggaaaa aaaacacggc 1260 gaagactggg gcaaagtgta cgatgaagcc tgggagcgta tcgacaaaaa agtggaaggt 1320 ttgtcgaaac atattaaact cgaagaagag cgccgcagtg aagatgcgca gtcaaaagca 1380 gcgctgacgg actggttacg tgcgaaagcc agttttgtga ttgaaggatt aaaagaagct 1440 gataaagatg aattttgccg ttgcgaactg aaactgcaaa aatggtatgg cgacctgcgc 1500 ggcaaaccgt tcgccattga ggcagaaaat agcatccttg atatctccgg tttcagcaaa 1560 caatataact gcgcgtttat ttggcagaaa gacggcgtga aaaagcttaa cctgtatctg 1620 atcattaact attttaaagg cgggaaactg cgtttcaaga aaatcaagcc ggaagcattt 1680 gaagccaatc gtttttatac cgttattaat aaaaaaagcg gtgaaatcgt gccgatggaa 1740 gttaatttta actttgatga tccgaacttg attattctgc cgctggcatt cggtaaacgg 1800 cagggccgtg agtttatctg gaacgacctg ttatcgctgg aaacgggcag cctgaaatta 1860 gccaacggtc gcgtcattga aaaaacgctc tacaaccgcc gcacccgcca ggatgagccg 1920 gcactgtttg tcgcgctgac ctttgaacgg cgtgaagtcc tcgatagcag caacatcaaa 1980 ccaatgaacc ttatcggtat tgatcgtggt gaaaacattc ctgccgttat cgccctgact 2040 gatccagaag gctgcccgct ttctcgcttc aaagattcac tgggcaaccc gacccatatc 2100 ctccgtattg gcgagagcta caaagagaaa cagcgtacca ttcaggcaaa gaaagaagtg 2160 gagcagcgtc gcgcgggcgg ctatagccgt aaatatgcca gcaaagctaa aaacctggcg 2220 gatgacatgg tgcgtaacac ggcgcgcgat ttgctgtact acgccgtcac ccaggacgcg 2280 atgctgattt ttgagaacct ctcccgcggt tttgggcgtc agggtaaacg cacgtttatg 2340 gcggaacgcc agtatacgcg tatggaggac tggctgaccg cgaagctggc ctatgaaggc 2400 ttgtctaaaa cttacctgag caagaccctg gctcagtaca ccagtaaaac ctgtagtaat 2460 tgcggcttta ccatcaccag cgccgattat gaccgcgtgc tggaaaagct gaagaaaacc 2520 gccaccggct ggatgaccac catcaatggt aaagagctta aagtcgaagg gcagattact 2580 tattacaacc gttataagcg gcaaaacgtg gtgaaagatc tgtcggttga gctggaccgt 2640 ttgtctgaag aaagcgtgaa caatgatatc agctcctgga ccaaaggtcg ttccggcgaa 2700 gcgttaagtc tgttgaaaaa gcgctttagc catcgcccgg tgcaggaaaa attcgtttgc 2760 ctgaactgtg gcttcgaaac ccacgccgac gagcaagcgg cgctcaatat tgcgcgtagc 2820 tggctgttcc tgcgcagcca ggaatataaa aaatatcaaa ccaacaaaac aactggcaat 2880 accgacaagc gtgcctttgt tgaaacctgg cagagcttct atcgcaagaa gctgaaagag 2940 gtctggaaac cggcggtacc acctgcgcca aagaaaaaac gcaaagtgag cgaaaatctt 3000 tattttcaag gtagcgcatg gagtcatcct caattcgaga aaggtggagg ttctggcggt 3060 ggatcgggag gttcagcgtg gagccacccg cagttcgaaa aaggaagggg atccggctgc 3120 taa 3123 <210> 341 <211> 2928 <212> DNA <213> Artificial Sequence <220> <223> CasX 457 variant <400> 341 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300 cagcccgctc ctaagaacat cgaccagaga aagctgatcc ccgtgaagga cggcaacgag 360 agactgacct ctagcggctt tgcctgcagc cagtgttgcc agcctctgta cgtgtacaag 420 ctggaacaag tgaacgacaa gggcaagccc cacaccaact acttcggcag atgcaacgtg 480 tccgagcacg agaggctgat cctgctgtct cctcacaagc ccgaggccaa cgatgagctg 540 gtcacataca gcctgggcaa gttcggacag agagccctgg acttctacag catccacgtg 600 accagggaga gcaatcaccc tgtgaagccc ctggaacaga tcggcggcaa tagctgtgcc 660 tctggacctg tgggaaaagc cctgagcgac gcctgtatgg gagccgtggc atccttcctg 720 accaagtacc aggacatcat cctggaacac aagaaagtga tcaagaagaa cgagaaaaga 780 ctggccaacc tcaaggatat cgccagcgct aacggcctgg cctttcctaa gatcaccctg 840 cctccacagc ctcacaccaa agagggcatc gaggcctaca acaacgtggt ggcccagatc 900 gtgatttggg tcaacctgaa tctgtggcag aagctgaaga tcggcaggga cgaagccaag 960 ccactgcaga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 1020 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 1080 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 1140 ctgagcagcc ccgaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 1200 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 1260 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 1320 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 1380 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 1440 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 1500 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 1560 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 1620 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 1680 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 1740 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 1800 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaacccctg 1860 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 1920 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 1980 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 2040 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 2100 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 2160 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 2220 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 2280 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 2340 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 2400 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 2460 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 2520 aaagagctga aggttgaggg ccagatcacc tactacaaca ggaggaagag gcagaacgtc 2580 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 2640 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 2700 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 2760 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 2820 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 2880 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtg 2928 <210> 342 <211> 2928 <212> DNA <213> Artificial Sequence <220> <223> CasX 438 variant <400> 342 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300 cagcccgctc ctaagaacat cgaccagaga aagctgatcc ccgtgaagga cggcaacgag 360 agactgacct ctagcggctt tgcctgcagc cagtgttgcc agcctctgta cgtgtacaag 420 ctggaacaag tgaacgacaa gggcaagccc cacaccaact acttcggcag atgcaacgtg 480 tccgagcacg agaggctgat cctgctgtct cctcacaagc ccgaggccaa cgatgagctg 540 gtcacataca gcctgggcaa gttcggacag agagccctgg acttctacag catccacgtg 600 accagggaga gcaatcaccc tgtgaagccc ctggaacaga tcggcggcaa tagctgtgcc 660 tctggacctg tgggaaaagc cctgagcgac gcctgtatgg gagccgtggc atccttcctg 720 accaagtacc aggacatcat cctggaacac cagaaagtga tcaagaagaa cgagaaaaga 780 ctggccaacc tcaaggatat cgccagcgct aacggcctgg cctttcctaa gatcaccctg 840 cctccacagc ctcacaccaa agagggcatc gaggcctaca acaacgtggt ggcccagatc 900 gtgatttggg tcaacctgaa tctgtggcag aagctgaaga tcggcaggga cgaagccaag 960 ccactgcaga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 1020 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 1080 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 1140 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 1200 ctgctgaagc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 1260 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 1320 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 1380 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 1440 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 1500 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 1560 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 1620 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 1680 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 1740 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 1800 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 1860 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 1920 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 1980 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 2040 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 2100 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 2160 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 2220 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 2280 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 2340 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 2400 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 2460 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 2520 aaagagctga aggttgaggg ccagatcacc tactacaaca ggaggaagag gcagaacgtc 2580 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 2640 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 2700 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 2760 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 2820 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 2880 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtg 2928 <210> 343 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX 119 variant <400> 343 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val 195 200 205 Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu 225 230 235 240 Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys 245 250 255 Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly 260 265 270 Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys 305 310 315 320 Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 344 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX 457 variant <400> 344 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val 195 200 205 Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu 225 230 235 240 Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys Lys 245 250 255 Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly 260 265 270 Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys 305 310 315 320 Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Pro 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp 385 390 395 400 Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 345 <211> 976 <212> PRT <213> Artificial Sequence <220> <223> CasX 438 variant <400> 345 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu 100 105 110 Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala 115 120 125 Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val 130 135 140 Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala 165 170 175 Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala 180 185 190 Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val 195 200 205 Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val 210 215 220 Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu 225 230 235 240 Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys 245 250 255 Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly 260 265 270 Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu 275 280 285 Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val 290 295 300 Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys 305 310 315 320 Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg 325 330 335 Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys 340 345 350 Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu 355 360 365 Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu 370 375 380 Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp 385 390 395 400 Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val 405 410 415 Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser 420 425 430 Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser 435 440 445 Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile 450 455 460 Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu 465 470 475 480 Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile 485 490 495 Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr 500 505 510 Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu 515 520 525 Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys 530 535 540 Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn 545 550 555 560 Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp 565 570 575 Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly 580 585 590 Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu 595 600 605 Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg 610 615 620 Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg 625 630 635 640 Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly 645 650 655 Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro 660 665 670 Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr 675 680 685 His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile 690 695 700 Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg 705 710 715 720 Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn 725 730 735 Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu 740 745 750 Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr 755 760 765 Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala 770 775 780 Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu 785 790 795 800 Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr 805 810 815 Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr 820 825 830 Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln 835 840 845 Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu 850 855 860 Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile 865 870 875 880 Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys 885 890 895 Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn 900 905 910 Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala 915 920 925 Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr 930 935 940 Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp 945 950 955 960 Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 965 970 975 <210> 346 <211> 2931 <212> DNA <213> Artificial Sequence <220> <223> CasX 488 Variant <400> 346 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagttcggc 1200 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg catcgaccgg 1980 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 2400 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 2460 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 2520 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 2580 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 2640 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 2700 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 2760 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 2820 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 2880 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt g 2931 <210> 347 <211> 2931 <212> DNA <213> Artificial Sequence <220> <223> CasX 491 Variant <400> 347 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 1200 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 1980 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 2400 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 2460 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 2520 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 2580 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 2640 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 2700 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 2760 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 2820 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 2880 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt g 2931 <210> 348 <211> 2934 <212> DNA <213> Artificial Sequence <220> <223> CasX 515 Variant <400> 348 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 1200 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 1980 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340 gattggctca cagctaaact ggcctacgag ggactgccca gcaagaccta cctgtccaaa 2400 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 2460 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 2520 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 2580 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 2640 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 2700 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 2760 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 2820 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 2880 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtg 2934 <210> 349 <211> 2934 <212> DNA <213> Artificial Sequence <220> <223> CasX 527 Variant <400> 349 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60 aaggccggca agacacgggg ccccatgaaa accctgctcg tcagagtgat gacccctgac 120 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 180 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 240 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 300 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 360 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 420 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 480 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 540 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 600 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 660 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 720 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 780 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 840 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 900 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 960 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 1020 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 1080 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 1140 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 1200 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 1260 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 1320 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 1380 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 1440 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 1500 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 1560 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 1620 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 1680 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 1740 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 1800 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 1860 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 1920 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 1980 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 2040 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 2100 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 2160 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 2220 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 2280 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 2340 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 2400 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 2460 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 2520 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 2580 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 2640 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 2700 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 2760 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 2820 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 2880 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtg 2934 <210> 350 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX 488 Variant <400> 350 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 351 <211> 977 <212> PRT <213> Artificial Sequence <220> <223> CasX 491 Variant <400> 351 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val <210> 352 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX 515 Variant <400> 352 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu 20 25 30 Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg 35 40 45 Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala 50 55 60 Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile 65 70 75 80 Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met 85 90 95 Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu 100 105 110 Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala 115 120 125 Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val 130 135 140 Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val 145 150 155 160 Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys 165 170 175 Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro 195 200 205 Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe 225 230 235 240 Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys 245 250 255 Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu 260 265 270 Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala 305 310 315 320 Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 353 <211> 978 <212> PRT <213> Artificial Sequence <220> <223> CasX 527 Variant <400> 353 Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp 1 5 10 15 Ser Asn Thr Lys Lys Ala Gly Lys Thr Arg Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys 100 105 110 Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe 115 120 125 Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln 130 135 140 Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu 165 170 175 Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His 195 200 205 Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser 225 230 235 240 Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val 245 250 255 Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys 260 265 270 Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp 305 310 315 320 Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val <210> 354 <211> 3120 <212> DNA <213> Artificial Sequence <220> <223> SV40 NLS-CasX-SV40 NLS-TEV cleavage site - TwinStrep tag <400> 354 atggctccga agaagaagcg aaaggtcagc caggaaatta aacgcatcaa caagatccgc 60 cgtcgtctgg taaaagacag caatacgaaa aaagccggaa aaaccggtcc gatgaaaacg 120 ctgctggtgc gcgtgatgac gccggatctc cgcgaacgtc ttgagaattt gcgtaagaaa 180 cctgaaaata ttccgcaacc gatttctaac acctcgcgcg ccaatctgaa taaactgctg 240 accgattaca ccgaaatgaa gaaagcgatt ctgcacgttt actgggaaga gttccagaaa 300 gacccggtcg gtctgatgag ccgcgttgcg caacctgcgc cgaaaaatat cgatcagcgc 360 aagttaatcc cggttaaaga tggtaatgaa cgtttaacct ccagcggctt tgcctgcagt 420 cagtgctgcc agccacttta tgtttataaa cttgaacagg ttaacgataa agggaaaccc 480 cataccaatt atttcggccg ctgcaatgtc agcgaacatg aacgcctgat tttgttaagc 540 ccgcataaac cggaagcgaa tgacgaactg gtgacctatt ccctgggtaa atttggtcag 600 cgggcgctgg atttttacag cattcatgtg acgcgggaaa gtaaccatcc ggtaaagcca 660 ctggaacaaa tcggcggtaa cagctgcgcc tctggcccgg ttggcaaagc gcttagcgat 720 gcctgtatgg gcgcggtggc gagctttctg acaaaatacc aggatattat cctggagcat 780 cagaaggtga tcaaaaagaa cgagaaacgt ctggcaaatt taaaggatat tgcctccgct 840 aacggcctgg cgttcccgaa gattacctta ccgccgcagc cgcacaccaa agaaggtatc 900 gaagcgtata acaacgttgt tgcccagatc gtcatctggg tgaatctcaa cctgtggcaa 960 aaactgaaaa ttggtcgtga tgaagcaaaa ccgttgcagc gactgaaagg attcccgtcg 1020 tttccgctgg ttgaacgaca ggcgaacgaa gtggattggt gggatatggt ttgtaacgtc 1080 aaaaaattga tcaacgaaaa aaaggaagat ggcaaagttt tctggcaaaa tctggcgggt 1140 tacaaacgtc aggaggcgtt gcttccgtat ctctcttcag aagaagatcg caaaaaaggc 1200 aagaagtttg ctcgctatca gtttggcgat ttattactgc atctggaaaa aaaacacggc 1260 gaagactggg gcaaagtgta cgatgaagcc tgggagcgta tcgacaaaaa agtggaaggt 1320 ttgtcgaaac atattaaact cgaagaagag cgccgcagtg aagatgcgca gtcaaaagca 1380 gcgctgacgg actggttacg tgcgaaagcc agttttgtga ttgaaggatt aaaagaagct 1440 gataaagatg aattttgccg ttgcgaactg aaactgcaaa aatggtatgg cgacctgcgc 1500 ggcaaaccgt tcgccattga ggcagaaaat agcatccttg atatctccgg tttcagcaaa 1560 caatataact gcgcgtttat ttggcagaaa gacggcgtga aaaagcttaa cctgtatctg 1620 atcattaact attttaaagg cgggaaactg cgtttcaaga aaatcaagcc ggaagcattt 1680 gaagccaatc gtttttatac cgttattaat aaaaaaagcg gtgaaatcgt gccgatggaa 1740 gttaatttta actttgatga tccgaacttg attattctgc cgctggcatt cggtaaacgg 1800 cagggccgtg agtttatctg gaacgacctg ttatcgctgg aaacgggcag cctgaaatta 1860 gccaacggtc gcgtcattga aaaaacgctc tacaaccgcc gcacccgcca ggatgagccg 1920 gcactgtttg tcgcgctgac ctttgaacgg cgtgaagtcc tcgatagcag caacatcaaa 1980 ccaatgaacc ttatcggtat tgatcgtggt gaaaacattc ctgccgttat cgccctgact 2040 gatccagaag gctgcccgct ttctcgcttc aaagattcac tgggcaaccc gacccatatc 2100 ctccgtattg gcgagagcta caaagagaaa cagcgtacca ttcaggcagc caaagaagtg 2160 gagcagcgtc gcgcgggcgg ctatagccgt aaatatgcca gcaaagctaa aaacctggcg 2220 gatgacatgg tgcgtaacac ggcgcgcgat ttgctgtact acgccgtcac ccaggacgcg 2280 atgctgattt ttgagaacct ctcccgcggt tttgggcgtc agggtaaacg cacgtttatg 2340 gcggaacgcc agtatacgcg tatggaggac tggctgaccg cgaagctggc ctatgaaggc 2400 ttgccgtcta aaacttacct gagcaagacc ctggctcagt acaccagtaa aacctgtagt 2460 aattgcggct ttaccatcac cagcgccgat tatgaccgcg tgctggaaaa gctgaagaaa 2520 accgccaccg gctggatgac caccatcaat ggtaaagagc ttaaagtcga agggcagatt 2580 acttattaca accgttataa gcggcaaaac gtggtgaaag atctgtcggt tgagctggac 2640 cgtttgtctg aagaaagcgt gaacaatgat atcagctcct ggaccaaagg tcgttccggc 2700 gaagcgttaa gtctgttgaa aaagcgcttt agccatcgcc cggtgcagga aaaattcgtt 2760 tgcctgaact gtggcttcga aacccacgcc gacgagcaag cggcgctcaa tattgcgcgt 2820 agctggctgt tcctgcgcag ccaggaatat aaaaaatatc aaaccaacaa aacaactggc 2880 aataccgaca agcgtgcctt tgttgaaacc tggcagagct tctatcgcaa aaaactgaaa 2940 gaggtctgga aaccggcggt agcgccaaag aaaaaacgca aagtgagcga aaatctttat 3000 tttcaaggta gcgcatggag tcatcctcaa ttcgagaaag gtggaggttc tggcggtgga 3060 tcgggaggtt cagcgtggag ccacccgcag ttcgaaaaag gaaggggatc cggctgctaa 3120 <210> 355 <211> 987 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 355 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp 115 120 125 Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys 130 135 140 Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys 145 150 155 160 Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg 165 170 175 Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val 180 185 190 Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser 195 200 205 Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu Gln 210 215 220 Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu Ser 225 230 235 240 Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp 245 250 255 Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg Leu 260 265 270 Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys 275 280 285 Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala Tyr 290 295 300 Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu Trp 305 310 315 320 Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu 325 330 335 Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val 340 345 350 Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys 355 360 365 Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg 370 375 380 Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys 385 390 395 400 Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu 405 410 415 Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp 420 425 430 Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu 435 440 445 Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr 450 455 460 Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu 465 470 475 480 Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp 485 490 495 Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser 500 505 510 Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile 515 520 525 Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn 530 535 540 Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala 545 550 555 560 Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu 565 570 575 Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile 580 585 590 Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp 595 600 605 Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly 610 615 620 Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu 625 630 635 640 Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp 645 650 655 Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu 660 665 670 Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu 675 680 685 Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile 690 695 700 Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu 705 710 715 720 Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys 725 730 735 Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu 740 745 750 Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu 755 760 765 Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg 770 775 780 Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu 785 790 795 800 Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser 805 810 815 Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp 820 825 830 Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr 835 840 845 Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn 850 855 860 Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp 865 870 875 880 Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys 885 890 895 Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His 900 905 910 Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr 915 920 925 His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 930 935 940 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly 945 950 955 960 Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg 965 970 975 Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val 980 985 <210> 356 <211> 986 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 356 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val 980 985 <210> 357 <211> 996 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 357 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys 980 985 990 Lys Arg Lys Val 995 <210> 358 <211> 1006 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 358 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro His Lys Lys 980 985 990 Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser Lys 995 1000 1005 <210> 359 <211> 1007 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 359 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Gln Arg Pro 980 985 990 Gly Pro Tyr Asp Arg Pro Gln Arg Pro Gly Pro Tyr Asp Arg Pro 995 1000 1005 <210> 360 <211> 1005 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 360 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Leu Ser Pro 980 985 990 Ser Leu Ser Pro Leu Leu Ser Pro Ser Leu Ser Pro Leu 995 1000 1005 <210> 361 <211> 1008 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 361 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Met Ser Ser Gly 115 120 125 Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu 130 135 140 Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys 145 150 155 160 Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro 165 170 175 Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln 180 185 190 Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His 195 200 205 Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly 210 215 220 Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser 225 230 235 240 Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile 245 250 255 Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala 260 265 270 Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr 275 280 285 Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile 290 295 300 Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu 305 310 315 320 Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val 325 330 335 Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val 340 345 350 Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln 355 360 365 Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser 370 375 380 Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe 385 390 395 400 Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly 405 410 415 Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly 420 425 430 Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala 435 440 445 Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe 450 455 460 Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys 465 470 475 480 Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe 485 490 495 Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys 500 505 510 Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu 515 520 525 Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe 530 535 540 Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val 545 550 555 560 Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn 565 570 575 Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg 580 585 590 Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly 595 600 605 Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn 610 615 620 Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe 625 630 635 640 Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu 645 650 655 Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr 660 665 670 Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn 675 680 685 Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg 690 695 700 Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr 705 710 715 720 Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val 725 730 735 Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala 740 745 750 Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys 755 760 765 Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu 770 775 780 Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys 785 790 795 800 Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr 805 810 815 Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr 820 825 830 Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu 835 840 845 Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys 850 855 860 Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn 865 870 875 880 Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu 885 890 895 Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys 900 905 910 Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn 915 920 925 Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr 930 935 940 Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu 945 950 955 960 Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro 965 970 975 Ala Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Arg Gly 980 985 990 Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His Arg Lys 995 1000 1005 <210> 362 <211> 1013 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 362 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Ser Arg Arg 980 985 990 Arg Lys Ala Asn Pro Thr Lys Leu Ser Glu Asn Ala Lys Lys Leu Ala 995 1000 1005 Lys Glu Val Glu Asn 1010 <210> 363 <211> 998 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 363 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala 980 985 990 Lys Arg Val Lys Leu Asp 995 <210> 364 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 364 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Lys Arg Ser 980 985 990 Phe Ser Lys Ala Phe 995 <210> 365 <211> 1008 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 365 Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys 1 5 10 15 Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu 20 25 30 Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu 35 40 45 Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg 50 55 60 Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala 65 70 75 80 Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu 85 90 95 Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys 100 105 110 Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe 115 120 125 Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln 130 135 140 Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn 145 150 155 160 Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu 165 170 175 Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg 180 185 190 Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro 195 200 205 Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro 210 215 220 Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe 225 230 235 240 Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys 245 250 255 Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn 260 265 270 Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys 275 280 285 Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp 290 295 300 Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala 305 310 315 320 Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu 325 330 335 Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys 340 345 350 Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn 355 360 365 Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser 370 375 380 Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly 385 390 395 400 Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys 405 410 415 Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu 420 425 430 Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln 435 440 445 Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val 450 455 460 Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu 465 470 475 480 Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala 485 490 495 Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln 500 505 510 Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn 515 520 525 Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys 530 535 540 Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile 545 550 555 560 Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe 565 570 575 Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln 580 585 590 Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser 595 600 605 Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg 610 615 620 Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu 625 630 635 640 Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile 645 650 655 Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp 660 665 670 Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro 675 680 685 Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr 690 695 700 Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser 705 710 715 720 Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg 725 730 735 Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met 740 745 750 Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg 755 760 765 Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr 770 775 780 Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr 785 790 795 800 Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile 805 810 815 Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala 820 825 830 Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly 835 840 845 Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp 850 855 860 Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp 865 870 875 880 Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu 885 890 895 Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu 900 905 910 Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile 915 920 925 Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln 930 935 940 Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr 945 950 955 960 Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala 965 970 975 Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Lys Arg Gly 980 985 990 Ile Asn Asp Arg Asn Phe Trp Arg Gly Glu Asn Glu Arg Lys Thr Arg 995 1000 1005 <210> 366 <211> 1007 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 366 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Met Gln Glu Ile Lys 1 5 10 15 Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys 20 25 30 Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met 35 40 45 Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu 50 55 60 Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys 65 70 75 80 Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr 85 90 95 Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala 100 105 110 Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys 115 120 125 Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys 130 135 140 Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly 145 150 155 160 Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu 165 170 175 Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu 210 215 220 Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln 245 250 255 Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg 260 265 270 Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro 275 280 285 Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala 290 295 300 Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys Lys Arg Lys Val 995 1000 1005 <210> 367 <211> 1009 <212> PRT <213> Artificial Sequence <220> <223> CasX Variant Sequence <400> 367 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Met Gln Glu Ile Lys 1 5 10 15 Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys 20 25 30 Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met 35 40 45 Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu 50 55 60 Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys 65 70 75 80 Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr 85 90 95 Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala 100 105 110 Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys 115 120 125 Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys 130 135 140 Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly 145 150 155 160 Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu 165 170 175 Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu 210 215 220 Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln 245 250 255 Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg 260 265 270 Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro 275 280 285 Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala 290 295 300 Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala Lys Arg Val Lys Leu 995 1000 1005 Asp <210> 368 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 368 ccaaagaaga agcggaaggt c 21 <210> 369 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 369 cacaagaaga aacatccaga cgcatcagtc aactttagcg agttcagtaa a 51 <210> 370 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 370 cagcgccctg ggccttacga taggccgcaa agacccggac cgtatgatcg ccct 54 <210> 371 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 371 ctcagcccga gtcttagtcc actgctttcc ccgtccctgt ctccactg 48 <210> 372 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 372 cggggcaagg gtggcaaggg gcttggcaag gggggggcaa agaggcacag gaag 54 <210> 373 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 373 agccgccgca gaaaagccaa tcctacaaaa ctgtcagaaa atgcgaaaaa acttgctaag 60 gaggtggaaa a 71 <210> 374 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 374 cctgccgcaa agcgagtgaa attggac 27 <210> 375 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 375 aagcggtcct tcagtaaggc cttt 24 <210> 376 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 376 aaacggggaa taaacgaccg gaacttctgg cgcggggaaa acgagcgcaa aacccga 57 <210> 377 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> nuclear localization sequence <400> 377 His Lys Lys Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser 1 5 10 15 Lys <210> 378 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 387 Variant Sequence <400> 378 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca gggagagcaa tcaccctgtg 660 aagcccctgg aacagatcgg cggcaatagc tgtgcctctg gacctgtggg aaaagccctg 720 agcgacgcct gtatgggagc cgtggcatcc ttcctgacca agtaccagga catcatcctg 780 gaacaccaga aagtgatcaa gaagaacgag aaaagactgg ccaacctcaa ggatatcgcc 840 agcgctaacg gcctggcctt tcctaagatc accctgcctc cacagcctca caccaaagag 900 ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga tttgggtcaa cctgaatctg 960 tggcagaagc tgaagatcgg cagggacgaa gccaagccac tgcagagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagttc ggcgacctgc tgctgcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcatcgac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 379 <211> 2988 <212> DNA <213> Artificial Sequence <220> <223> CasX 395 Variant Sequence <400> 379 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360 agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420 agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480 ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540 tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200 ggcaagaagt tcgccagata ccagttcggc gacctgctgc tgcacctgga aaagaagcac 1260 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980 aagcccatga acctgatcgg catcgaccgg ggcgagaata tccctgctgt gatcgccctg 2040 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988 <210> 380 <211> 2988 <212> DNA <213> Artificial Sequence <220> <223> CasX 485 Variant Sequence <400> 380 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360 agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420 agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480 ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540 tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 1260 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580 acctactaca acaggaggaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988 <210> 381 <211> 2988 <212> DNA <213> Artificial Sequence <220> <223> CasX 486 Variant Seqence <400> 381 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360 agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420 agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480 ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540 tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200 ggcaagaagt tcgccagata ccagctgggc gacctgctga agcacctgga aaagaagcac 1260 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580 acctactaca acaggaggaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988 <210> 382 <211> 2988 <212> DNA <213> Artificial Sequence <220> <223> CasX 487 Variant Sequence <400> 382 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360 agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420 agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480 ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540 tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 1260 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988 <210> 383 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 488 Variant Sequence <400> 383 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagttc ggcgacctgc tgctgcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcatcgac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 384 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 489 Variant Sequence <400> 384 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggag gaagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 385 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 490 Variant Sequence <400> 385 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgaagcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggag gaagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 386 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 491 Variant Sequence <400> 386 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 387 <211> 2991 <212> DNA <213> Artificial Sequence <220> <223> CasX 495 Variant Sequence <400> 387 atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600 ggacagagag ccctggactt ctacagcatc cacgtgacca gggagagcaa tcaccctgtg 660 aagcccctgg aacagatcgg cggcaatagc tgtgcctctg gacctgtggg aaaagccctg 720 agcgacgcct gtatgggagc cgtggcatcc ttcctgacca agtaccagga catcatcctg 780 gaacaccaga aagtgatcaa gaagaacgag aaaagactgg ccaacctcaa ggatatcgcc 840 agcgctaacg gcctggcctt tcctaagatc accctgcctc cacagcctca caccaaagag 900 ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga tttgggtcaa cctgaatctg 960 tggcagaagc tgaagatcgg cagggacgaa gccaagccac tgcagagact gaagggcttc 1020 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991 <210> 388 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 387 Variant Sequence <400> 388 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu 210 215 220 Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln 245 250 255 Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg 260 265 270 Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro 275 280 285 Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala 290 295 300 Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 389 <211> 1005 <212> PRT <213> Artificial Sequence <220> <223> CasX 395 Variant Sequence <400> 389 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp 115 120 125 Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys 130 135 140 Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys 145 150 155 160 Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg 165 170 175 Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val 180 185 190 Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser 195 200 205 Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln 210 215 220 Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser 225 230 235 240 Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp 245 250 255 Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu 260 265 270 Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser 275 280 285 Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr 290 295 300 Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp 305 310 315 320 Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu 325 330 335 Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val 340 345 350 Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys 355 360 365 Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg 370 375 380 Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys 385 390 395 400 Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu 405 410 415 Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp 420 425 430 Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu 435 440 445 Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr 450 455 460 Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu 465 470 475 480 Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp 485 490 495 Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser 500 505 510 Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile 515 520 525 Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn 530 535 540 Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala 545 550 555 560 Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu 565 570 575 Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile 580 585 590 Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp 595 600 605 Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly 610 615 620 Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu 625 630 635 640 Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp 645 650 655 Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu 660 665 670 Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu 675 680 685 Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile 690 695 700 Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu 705 710 715 720 Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys 725 730 735 Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu 740 745 750 Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu 755 760 765 Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg 770 775 780 Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu 785 790 795 800 Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser 805 810 815 Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp 820 825 830 Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr 835 840 845 Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn 850 855 860 Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp 865 870 875 880 Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys 885 890 895 Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His 900 905 910 Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr 915 920 925 His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 930 935 940 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly 945 950 955 960 Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg 965 970 975 Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys 980 985 990 Lys Arg Lys Val Thr Ser Pro Lys Lys Lys Arg Lys Val 995 1000 1005 <210> 390 <211> 996 <212> PRT <213> Artificial Sequence <220> <223> CasX 485 Variant Sequence <400> 390 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp 115 120 125 Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys 130 135 140 Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys 145 150 155 160 Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg 165 170 175 Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val 180 185 190 Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser 195 200 205 Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln 210 215 220 Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser 225 230 235 240 Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp 245 250 255 Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu 260 265 270 Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser 275 280 285 Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr 290 295 300 Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp 305 310 315 320 Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu 325 330 335 Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val 340 345 350 Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys 355 360 365 Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg 370 375 380 Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys 385 390 395 400 Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His Leu 405 410 415 Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp 420 425 430 Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu 435 440 445 Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr 450 455 460 Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu 465 470 475 480 Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp 485 490 495 Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser 500 505 510 Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile 515 520 525 Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn 530 535 540 Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala 545 550 555 560 Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu 565 570 575 Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile 580 585 590 Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp 595 600 605 Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly 610 615 620 Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu 625 630 635 640 Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp 645 650 655 Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu 660 665 670 Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu 675 680 685 Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile 690 695 700 Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu 705 710 715 720 Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys 725 730 735 Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu 740 745 750 Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu 755 760 765 Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg 770 775 780 Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu 785 790 795 800 Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser 805 810 815 Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp 820 825 830 Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr 835 840 845 Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn 850 855 860 Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp 865 870 875 880 Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys 885 890 895 Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His 900 905 910 Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr 915 920 925 His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 930 935 940 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly 945 950 955 960 Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg 965 970 975 Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys 980 985 990 Lys Arg Lys Val 995 <210> 391 <211> 996 <212> PRT <213> Artificial Sequence <220> <223> CasX 486 Variant Seqence <400> 391 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp 115 120 125 Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys 130 135 140 Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys 145 150 155 160 Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg 165 170 175 Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val 180 185 190 Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser 195 200 205 Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln 210 215 220 Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser 225 230 235 240 Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp 245 250 255 Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu 260 265 270 Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser 275 280 285 Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr 290 295 300 Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp 305 310 315 320 Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu 325 330 335 Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val 340 345 350 Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys 355 360 365 Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg 370 375 380 Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys 385 390 395 400 Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Lys His Leu 405 410 415 Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp 420 425 430 Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu 435 440 445 Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr 450 455 460 Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu 465 470 475 480 Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp 485 490 495 Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser 500 505 510 Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile 515 520 525 Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn 530 535 540 Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala 545 550 555 560 Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu 565 570 575 Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile 580 585 590 Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp 595 600 605 Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly 610 615 620 Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu 625 630 635 640 Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp 645 650 655 Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu 660 665 670 Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu 675 680 685 Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile 690 695 700 Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu 705 710 715 720 Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys 725 730 735 Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu 740 745 750 Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu 755 760 765 Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg 770 775 780 Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu 785 790 795 800 Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser 805 810 815 Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp 820 825 830 Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr 835 840 845 Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn 850 855 860 Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp 865 870 875 880 Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys 885 890 895 Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His 900 905 910 Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr 915 920 925 His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 930 935 940 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly 945 950 955 960 Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg 965 970 975 Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys 980 985 990 Lys Arg Lys Val 995 <210> 392 <211> 996 <212> PRT <213> Artificial Sequence <220> <223> CasX 487 Variant Sequence <400> 392 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp 115 120 125 Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys 130 135 140 Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys 145 150 155 160 Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg 165 170 175 Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val 180 185 190 Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser 195 200 205 Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln 210 215 220 Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser 225 230 235 240 Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp 245 250 255 Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu 260 265 270 Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser 275 280 285 Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr 290 295 300 Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp 305 310 315 320 Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu 325 330 335 Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val 340 345 350 Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys 355 360 365 Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg 370 375 380 Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys 385 390 395 400 Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His Leu 405 410 415 Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp 420 425 430 Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu 435 440 445 Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr 450 455 460 Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu 465 470 475 480 Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp 485 490 495 Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser 500 505 510 Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile 515 520 525 Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn 530 535 540 Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala 545 550 555 560 Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu 565 570 575 Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile 580 585 590 Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp 595 600 605 Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly 610 615 620 Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu 625 630 635 640 Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp 645 650 655 Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu 660 665 670 Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu 675 680 685 Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile 690 695 700 Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu 705 710 715 720 Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys 725 730 735 Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu 740 745 750 Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu 755 760 765 Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg 770 775 780 Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu 785 790 795 800 Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser 805 810 815 Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp 820 825 830 Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr 835 840 845 Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn 850 855 860 Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp 865 870 875 880 Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys 885 890 895 Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His 900 905 910 Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr 915 920 925 His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe 930 935 940 Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly 945 950 955 960 Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg 965 970 975 Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys 980 985 990 Lys Arg Lys Val 995 <210> 393 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 488 Variant Sequence <400> 393 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala 210 215 220 Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln 245 250 255 Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg 260 265 270 Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro 275 280 285 Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala 290 295 300 Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 394 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 489 Variant Sequence <400> 394 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala 210 215 220 Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln 245 250 255 Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg 260 265 270 Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro 275 280 285 Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala 290 295 300 Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 395 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 490 Variant Sequence <400> 395 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala 210 215 220 Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln 245 250 255 Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg 260 265 270 Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro 275 280 285 Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala 290 295 300 Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Lys His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 396 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 491 Variant Sequence <400> 396 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala 210 215 220 Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln 245 250 255 Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg 260 265 270 Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro 275 280 285 Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala 290 295 300 Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 397 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> CasX 495 Variant Sequence <400> 397 Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg 1 5 10 15 Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys 20 25 30 Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr 35 40 45 Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn 50 55 60 Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu 65 70 75 80 Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp 85 90 95 Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln 100 105 110 Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp 115 120 125 Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly 130 135 140 Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys 145 150 155 160 Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys 165 170 175 Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala 180 185 190 Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr 195 200 205 Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu 210 215 220 Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu 225 230 235 240 Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln 245 250 255 Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg 260 265 270 Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro 275 280 285 Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala 290 295 300 Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu 305 310 315 320 Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg 325 330 335 Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu 340 345 350 Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu 355 360 365 Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys 370 375 380 Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys 385 390 395 400 Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His 405 410 415 Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala 420 425 430 Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys 435 440 445 Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu 450 455 460 Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys 465 470 475 480 Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys 485 490 495 Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn 500 505 510 Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe 515 520 525 Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile 530 535 540 Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu 545 550 555 560 Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly 565 570 575 Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu 580 585 590 Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile 595 600 605 Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn 610 615 620 Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp 625 630 635 640 Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu 645 650 655 Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly 660 665 670 Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro 675 680 685 Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg 690 695 700 Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys 705 710 715 720 Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser 725 730 735 Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp 740 745 750 Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn 755 760 765 Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu 770 775 780 Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr 785 790 795 800 Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr 805 810 815 Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr 820 825 830 Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr 835 840 845 Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr 850 855 860 Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu 865 870 875 880 Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr 885 890 895 Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser 900 905 910 His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu 915 920 925 Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu 930 935 940 Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr 945 950 955 960 Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr 965 970 975 Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys 980 985 990 Lys Lys Arg Lys Val 995 <210> 398 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> T7 promoter primer <400> 398 gaaattaata cgactcacta ta 22 <210> 399 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> sg2 backbone fwd <400> 399 gaaattaata cgactcacta taggtactgg cgcttttatc tcattacttt gagagccatc 60 accagcgact atgtcgtatg ggtaaag 87 <210> 400 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> sg2 backbone rev <400> 400 ctttgatgct tcttatttat cggatttctc tccgataaat aagcgcttta cccatacgac 60 atagtcgctg gtgatggc 78 <210> 401 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> sg2.7.37 spacer primer <400> 401 cggagcgaga catctcggcc ctttgatgct tcttatttat cggatttctc tccg 54 <210> 402 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> sg32 backbone fwd <400> 402 gaaattaata cgactcacta taggtactgg cgcttttatc tcattacttt gagagccatc 60 accagcgact atgtcgtatg ggtaaagcgc 90 <210> 403 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> sg32 backbone rev <400> 403 ctttgatgct tccctccgaa gagggcgctt tacccatacg acatag 46 <210> 404 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> sg32.7.37 spacer primer <400> 404 cggagcgaga catctcggcc ctttgatgct tccctccgaa gag 43 <210> 405 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> sg64 backbone fwd <400> 405 gaaattaata cgactcacta taggtactgg cgcctttatc tcattacttt gagagccatc 60 accagcgact atgtcgtatg ggtaaagcgc 90 <210> 406 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> sg64 backbone rev <400> 406 ctttgatgct tcttacggac cgaagtccgt aagcgcttta cccatacgac atag 54 <210> 407 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> sg64.7.37 spacer primer <400> 407 cggagcgaga catctcggcc ctttgatgct tcttacggac cgaag 45 <210> 408 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> sg174 backbone fwd <400> 408 gaaattaata cgactcacta taactggcgc ttttatctga ttactttgag agccatcacc 60 agcgactatg tcgtagtggg taaagct 87 <210> 409 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> sg174 backbone rev <400> 409 ctttgatgct ccctccgaag agggagcttt acccactacg acatagtcgc 50 <210> 410 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> sg174.7.37 spacer primer <400> 410 cggagcgaga catctcggcc ctttgatgct ccctcc 36 <210> 411 <211> 130 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 411 gguacuggcg cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60 uaaagcgcuu auuuaucgga gagaaauccg auaaauaaga agcaucaaag ggccgagaug 120 ucucgcuccg 130 <210> 412 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 412 gguacuggcg cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60 uaaagcgccc ucuucggagg gaagcaucaa agggccgaga ugucucg 107 <210> 413 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 413 gguacuggcg ccuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60 uaaagcgcuu acggacuucg guccguaaga agcaucaaag ggccgagaug ucucgcuccg 120 <210> 414 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gRNA sequence <400> 414 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaagg gccgagaugu cucgcuccg 109 <210> 415 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target oligo <400> 415 tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 416 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target oligo <400> 416 tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 417 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 417 agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgaatgct gtcagcttca 60 <210> 418 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 418 tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 419 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 419 agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgagtgct gtcagcttca 60 <210> 420 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 420 tgaagctgac agcactcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 421 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 421 agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgactgct gtcagcttca 60 <210> 422 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 422 tgaagctgac agcagtcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 423 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 423 agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgattgct gtcagcttca 60 <210> 424 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> gRNA target sequence <400> 424 tgaagctgac agcaatcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60 <210> 425 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> gRNA spacer sequence <400> 425 ctgcattcta gttgtggttt 20 <210> 426 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> gRNA plasmid sequence <400> 426 actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60 aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggttt 109 <210> 427 <211> 4557 <212> DNA <213> Artificial Sequence <220> <223> pXDP10 plasmid <400> 427 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920 aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980 tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040 aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100 gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160 cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220 tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280 ttcctgacca agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag 2340 aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400 accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460 cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520 gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc 2760 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac 3540 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557 <210> 428 <211> 4557 <212> DNA <213> Artificial Sequence <220> <223> pXDP11 plasmid <400> 428 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920 aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980 tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040 aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100 gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160 cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220 tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280 ttcctgacca agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag 2340 aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400 accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460 cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520 gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760 ggcgacctgc tgaagcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag 4140 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557 <210> 429 <211> 4557 <212> DNA <213> Artificial Sequence <220> <223> pXDP12 plasmid <400> 429 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920 aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980 tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040 aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100 gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160 cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220 tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280 ttcctgacca agtaccagga catcatcctg gaacacaaga aagtgatcaa gaagaacgag 2340 aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400 accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460 cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520 gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700 ccttacctga gcagccccga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420 cccctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag 4140 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557 <210> 430 <211> 4620 <212> DNA <213> Artificial Sequence <220> <223> psPax2 plasmid sequence <400> 430 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800 caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860 tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920 atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980 tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040 taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100 catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160 gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220 aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280 aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340 aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400 ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460 tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520 tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580 ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640 cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700 tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760 aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820 atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880 aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940 aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000 gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060 taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120 aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180 atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240 acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300 aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360 catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420 ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480 aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540 aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600 tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660 tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720 ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780 atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840 ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900 tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960 cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020 acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080 aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140 tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200 atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260 agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320 gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380 tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440 caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500 gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560 agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620 <210> 431 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 431 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 432 <211> 4563 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid Sequence <400> 432 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tga 4563 <210> 433 <211> 4620 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-(-1)-POL plasmid sequence <400> 433 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800 caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860 tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920 atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980 tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040 taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100 catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160 gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220 aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280 aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340 aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400 ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460 tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520 tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580 ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640 cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700 tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760 aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820 atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880 aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940 aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000 gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060 taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120 aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180 atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240 acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300 aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360 catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420 ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480 aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540 aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600 tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660 tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720 ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780 atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840 ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900 tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960 cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020 acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080 aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140 tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200 atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260 agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320 gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380 tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440 caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500 gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560 agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620 <210> 434 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 434 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 <210> 435 <211> 4869 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X-PR plasmid sequence <400> 435 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620 gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680 aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740 agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800 gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860 ttaaatttt 4869 <210> 436 <211> 4563 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 436 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tga 4563 <210> 437 <211> 1536 <212> DNA <213> Vesiculovirus Vesicular stomatitis virus <400> 437 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 438 <211> 511 <212> PRT <213> Vesiculovirus Vesicular stomatitis virus <400> 438 Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys 1 5 10 15 Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn 20 25 30 Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp 35 40 45 His Asn Asp Leu Ile Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser 50 55 60 His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp 65 70 75 80 Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile 100 105 110 Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Val Ile Val Gln 130 135 140 Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val 145 150 155 160 Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Tyr Ile Cys Pro Thr 165 170 175 Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu 180 185 190 Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp 195 200 205 Gly Glu Leu Ser Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser Asn 210 215 220 Tyr Phe Ala Tyr Glu Thr Gly Gly Lys Ala Cys Lys Met Gln Tyr Cys 225 230 235 240 Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala 245 250 255 Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly 260 265 270 Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile 275 280 285 Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp 290 295 300 Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr 305 310 315 320 Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile Asn 325 330 335 Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala 340 345 350 Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr 355 360 365 Glu Arg Glu Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Glu Ile 370 375 380 Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu 385 390 395 400 Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser 405 410 415 Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln 420 425 430 Leu Pro Asp Asp Glu Ser Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys 435 440 445 Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser 450 455 460 Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu 465 470 475 480 Val Leu Arg Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys 485 490 495 Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys 500 505 510 <210> 439 <211> 1536 <212> DNA <213> Lentivirus Human immunodeficiency virus <400> 439 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 440 <211> 511 <212> PRT <213> Lentivirus Human immunodeficiency virus <400> 440 Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys 1 5 10 15 Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn 20 25 30 Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp 35 40 45 His Asn Asp Leu Ile Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser 50 55 60 His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp 65 70 75 80 Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile 100 105 110 Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Val Ile Val Gln 130 135 140 Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val 145 150 155 160 Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Tyr Ile Cys Pro Thr 165 170 175 Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu 180 185 190 Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp 195 200 205 Gly Glu Leu Ser Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser Asn 210 215 220 Tyr Phe Ala Tyr Glu Thr Gly Gly Lys Ala Cys Lys Met Gln Tyr Cys 225 230 235 240 Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala 245 250 255 Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly 260 265 270 Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile 275 280 285 Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp 290 295 300 Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr 305 310 315 320 Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile Asn 325 330 335 Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala 340 345 350 Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr 355 360 365 Glu Arg Glu Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Glu Ile 370 375 380 Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu 385 390 395 400 Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser 405 410 415 Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln 420 425 430 Leu Pro Asp Asp Glu Ser Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys 435 440 445 Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser 450 455 460 Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu 465 470 475 480 Val Leu Arg Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys 485 490 495 Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys 500 505 510 <210> 441 <211> 2571 <212> DNA <213> Alpharetrovirus Avian leukosis virus <400> 441 atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg gggcaccatg 60 ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120 ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180 tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240 ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300 gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360 aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga tactaatacc 420 aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg ctctttcaat 480 atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta taaacttgat 540 ataataccaa tagataatga tactaccagc tataagttga caagttgtaa cacctcagtc 600 attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta ttgtgccccg 660 gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg accatgtaca 720 aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac tcaactgctg 780 ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt cacggacaat 840 gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac aagacccaac 900 aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt tgttacaata 960 ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa atggaataac 1020 actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa aacaataatc 1080 tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa ttgtggaggg 1140 gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa tagtacttgg 1200 agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc atgcagaata 1260 aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc tcccatcagt 1320 ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga tggtggtaat 1380 agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga caattggaga 1440 agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc acccaccaag 1500 gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc tttgttcctt 1560 gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct gacggtacag 1620 gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag ggctattgag 1680 gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca ggcaagaatc 1740 ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg ttgctctgga 1800 aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa atctctggaa 1860 cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa ttacacaagc 1920 ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga acaagaatta 1980 ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa ttggctgtgg 2040 tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat agtttttgct 2100 gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt tcagacccac 2160 ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg tggagagaga 2220 gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg ggacgatctg 2280 cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat tgtaacgagg 2340 attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg gaatctccta 2400 cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc cacagccata 2460 gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg tagagctatt 2520 cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata a 2571 <210> 442 <211> 856 <212> PRT <213> Alpharetrovirus Avian leukosis virus <400> 442 Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg 1 5 10 15 Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu 20 25 30 Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 35 40 45 Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu 50 55 60 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 65 70 75 80 Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp 85 90 95 Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp 100 105 110 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser 115 120 125 Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser 130 135 140 Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn 145 150 155 160 Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe 165 170 175 Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys 180 185 190 Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val 195 200 205 Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala 210 215 220 Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr 225 230 235 240 Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser 245 250 255 Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile 260 265 270 Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu 275 280 285 Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg 290 295 300 Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile 305 310 315 320 Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala 325 330 335 Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln 340 345 350 Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp 355 360 365 Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr 370 375 380 Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp 385 390 395 400 Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu 405 410 415 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys 420 425 430 Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn 435 440 445 Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu 450 455 460 Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 465 470 475 480 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 485 490 495 Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala 500 505 510 Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser 515 520 525 Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu 530 535 540 Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu 545 550 555 560 Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu 565 570 575 Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu 580 585 590 Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val 595 600 605 Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn 610 615 620 His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser 625 630 635 640 Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn 645 650 655 Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp 660 665 670 Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile 675 680 685 Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile 690 695 700 Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His 705 710 715 720 Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu 725 730 735 Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser 740 745 750 Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr 755 760 765 His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu 770 775 780 Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu 785 790 795 800 Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn 805 810 815 Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val 820 825 830 Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg 835 840 845 Gln Gly Leu Glu Arg Ile Leu Leu 850 855 <210> 443 <211> 1806 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 443 atggaagccg tcataaaggc atttctgact ggataccctg ggaagacgag caagaaggac 60 tccaaggaga aaccgctagc aacaagcaag aaagacccgg agaagacacc cttgctgcca 120 acgagagtta attatattct cattattggt gtcctggtct tgtgtgaggt tacgggggta 180 agagctgatg ttcacttact cgagcagcca gggaaccttt ggattacatg ggccaaccgt 240 acaggccaaa cggatttctg cctctctaca cagtcagcca cctccccttt tcaaacatgt 300 ttgataggta tcccgtctcc tatttccgaa ggtgatttta agggatatgt ttctgataca 360 aattgctcca ctgtgggaac tgaccggtta gtcttgtcag ccagcattac cggcggccct 420 gacaacagca ccaccctcac ttatcgaaag gtttcatgcc tgctgttaaa gctgaacgtc 480 tccatgtggg atgagccacc tgaactgcag ctgctaggtt cccagtctct ccctaacgtt 540 actaacatta ctcaggtctc tggcgtggcc gggggatgtg tatatttcgc cccaagggcc 600 actggcctgt ttttaggttg gtctaaacaa ggtctctcgc ggttcctcct ccgtcacccc 660 tttacctcca cctctaactc cacggaaccg ttcacggtgg tgacagcgga tagacacaat 720 ctttttatgg ggagtgagta ctgtggtgca tatggctaca gattttggga aatatataac 780 tgctcacaga ctaggaatac ttaccgctgt ggagacgtgg gaggtactgg cctccctgaa 840 acctggtgca gaggaaaagg aggtatatgg gttaatcaat caaaggaaat taatgagaca 900 gagccgttca gttttactgc gaactgtact ggcagtaatt tgggtaatgt cagcggatgt 960 tgcggagaac caatcacgat tctcccacta ggggcatgga tcgacagtac gcaaggtagt 1020 ttcactaaac caaaagcgct accacccgca attttcctca tttgtgggga tcgcgcatgg 1080 caaggaattc ccagtcgtcc ggtagggggc ccctgctatt taggcaagct taccatgtta 1140 gcacccaacc atacagatat tctcaaaata cttgctaatt cgtcgcggac aggtataaga 1200 cgtaaacgaa gcgtctcaca cctggatgat acatgctcag atgaagtaca gctttggggt 1260 cctacagcaa gaatctttgc atctatctta gccccggggg tagcagctgc gcaagcctta 1320 agagaaattg agagactagc ctgttggtcc gttaaacagg ctaacttgac aacatcactc 1380 ctcggggact tattggatga tgtcacgagt attcgacacg cggtcctgca gaaccgagcg 1440 gctattgact tcttgcttct agctcacggc catggctgtg aggacgttgc cggaatgtgt 1500 tgtttcaatc tgagtgatca cagtgaatct atacagaaga agttccagct aatgaagaaa 1560 catgtcaata agatcggcgt ggacagcgac ccaatcggaa gttggctgcg agggatattc 1620 gggggaatag gggaatgggc cgttcatctg ctaaaaggac tgcttttggg gcttgtagtt 1680 attttattgc tactggtgtg cctgccttgc cttttacaat ttgtgtctag tagtattcga 1740 aagatgatta atagttcaat caactatcat actgaataca ggaagatgca gggcggagca 1800 gtctag 1806 <210> 444 <211> 601 <212> PRT <213> Alpharetrovirus Rous sarcoma virus <400> 444 Met Glu Ala Val Ile Lys Ala Phe Leu Thr Gly Tyr Pro Gly Lys Thr 1 5 10 15 Ser Lys Lys Asp Ser Lys Glu Lys Pro Leu Ala Thr Ser Lys Lys Asp 20 25 30 Pro Glu Lys Thr Pro Leu Leu Pro Thr Arg Val Asn Tyr Ile Leu Ile 35 40 45 Ile Gly Val Leu Val Leu Cys Glu Val Thr Gly Val Arg Ala Asp Val 50 55 60 His Leu Leu Glu Gln Pro Gly Asn Leu Trp Ile Thr Trp Ala Asn Arg 65 70 75 80 Thr Gly Gln Thr Asp Phe Cys Leu Ser Thr Gln Ser Ala Thr Ser Pro 85 90 95 Phe Gln Thr Cys Leu Ile Gly Ile Pro Ser Pro Ile Ser Glu Gly Asp 100 105 110 Phe Lys Gly Tyr Val Ser Asp Thr Asn Cys Ser Thr Val Gly Thr Asp 115 120 125 Arg Leu Val Leu Ser Ala Ser Ile Thr Gly Gly Pro Asp Asn Ser Thr 130 135 140 Thr Leu Thr Tyr Arg Lys Val Ser Cys Leu Leu Leu Lys Leu Asn Val 145 150 155 160 Ser Met Trp Asp Glu Pro Pro Glu Leu Gln Leu Leu Gly Ser Gln Ser 165 170 175 Leu Pro Asn Val Thr Asn Ile Thr Gln Val Ser Gly Val Ala Gly Gly 180 185 190 Cys Val Tyr Phe Ala Pro Arg Ala Thr Gly Leu Phe Leu Gly Trp Ser 195 200 205 Lys Gln Gly Leu Ser Arg Phe Leu Leu Arg His Pro Phe Thr Ser Thr 210 215 220 Ser Asn Ser Thr Glu Pro Phe Thr Val Val Thr Ala Asp Arg His Asn 225 230 235 240 Leu Phe Met Gly Ser Glu Tyr Cys Gly Ala Tyr Gly Tyr Arg Phe Trp 245 250 255 Glu Ile Tyr Asn Cys Ser Gln Thr Arg Asn Thr Tyr Arg Cys Gly Asp 260 265 270 Val Gly Gly Thr Gly Leu Pro Glu Thr Trp Cys Arg Gly Lys Gly Gly 275 280 285 Ile Trp Val Asn Gln Ser Lys Glu Ile Asn Glu Thr Glu Pro Phe Ser 290 295 300 Phe Thr Ala Asn Cys Thr Gly Ser Asn Leu Gly Asn Val Ser Gly Cys 305 310 315 320 Cys Gly Glu Pro Ile Thr Ile Leu Pro Leu Gly Ala Trp Ile Asp Ser 325 330 335 Thr Gln Gly Ser Phe Thr Lys Pro Lys Ala Leu Pro Pro Ala Ile Phe 340 345 350 Leu Ile Cys Gly Asp Arg Ala Trp Gln Gly Ile Pro Ser Arg Pro Val 355 360 365 Gly Gly Pro Cys Tyr Leu Gly Lys Leu Thr Met Leu Ala Pro Asn His 370 375 380 Thr Asp Ile Leu Lys Ile Leu Ala Asn Ser Ser Arg Thr Gly Ile Arg 385 390 395 400 Arg Lys Arg Ser Val Ser His Leu Asp Asp Thr Cys Ser Asp Glu Val 405 410 415 Gln Leu Trp Gly Pro Thr Ala Arg Ile Phe Ala Ser Ile Leu Ala Pro 420 425 430 Gly Val Ala Ala Ala Gln Ala Leu Arg Glu Ile Glu Arg Leu Ala Cys 435 440 445 Trp Ser Val Lys Gln Ala Asn Leu Thr Thr Ser Leu Leu Gly Asp Leu 450 455 460 Leu Asp Asp Val Thr Ser Ile Arg His Ala Val Leu Gln Asn Arg Ala 465 470 475 480 Ala Ile Asp Phe Leu Leu Leu Ala His Gly His Gly Cys Glu Asp Val 485 490 495 Ala Gly Met Cys Cys Phe Asn Leu Ser Asp His Ser Glu Ser Ile Gln 500 505 510 Lys Lys Phe Gln Leu Met Lys Lys His Val Asn Lys Ile Gly Val Asp 515 520 525 Ser Asp Pro Ile Gly Ser Trp Leu Arg Gly Ile Phe Gly Gly Ile Gly 530 535 540 Glu Trp Ala Val His Leu Leu Lys Gly Leu Leu Leu Gly Leu Val Val 545 550 555 560 Ile Leu Leu Leu Leu Val Cys Leu Pro Cys Leu Leu Gln Phe Val Ser 565 570 575 Ser Ser Ile Arg Lys Met Ile Asn Ser Ser Ile Asn Tyr His Thr Glu 580 585 590 Tyr Arg Lys Met Gln Gly Gly Ala Val 595 600 <210> 445 <211> 1467 <212> DNA <213> Betaretrovirus Mouse mammary tumor virus <400> 445 atgggtaagt ttctcgccac tttgatttta ttcttccagt tctgccccct catcttcggt 60 gattacagcc ccagctgctg tactctcaca attggagtct cctcatacca ctctaaaccc 120 tgcaatcctg cccagccagt ttgttcgtgg accctcgacc tgctggccct ttcagcagat 180 caggccctac agcccccctg ccctaaccta gtaagttact ccagctacca tgccacctat 240 tccctatatc tattccctca ttggactaag aagccaaacc gaaatggcgg aggctattat 300 tcagcctctt attcagaccc ttgttcctta aagtgcccat acctggggtg ccaatcatgg 360 acctgcccct atacaggagc cgtctccagc ccctactgga agtttcaaca cgatgtcaat 420 tttactcaag aagtttcacg cctcaatatt aatctccatt tttcaaaatg cggttttccc 480 ttctcccttc tagtcgacgc tccaggatat gaccccatct ggttccttaa taccgaaccc 540 agccaactgc ctcccaccgc ccctcctcta ctcccccact ctaacctaga ccacatcctc 600 gagccctcta taccatggaa atcaaaactc ctgacccttg tccagttaac cctacaaagc 660 actaattata cttgcattgt ctgtatcgat cgtgccagcc tctccacttg gcacgtccta 720 tactctccca acgtctctgt tccatcctct tcttctaccc ccctccttta cccatcgtta 780 gcgcttccag ccccccacct gacgttacca tttaactgga cccactgctt tgacccccag 840 attcaagcta tagtctcctc cccctgtcat aactccctca tcctgccccc cttttccttg 900 tcacctgttc ccaccctagg atcccgctcc cgccgagcgg taccggtggc ggtctggctt 960 gtctccgccc tggccatggg agccggagtg gctggcggga ttaccggctc catgtccctc 1020 gcctcaggaa agagcctcct acatgaggtg gacaaagata tttcccagtt aactcaagca 1080 atagtcaaaa accacaaaaa tctactcaaa attgcgcagt atgctgccca gaacagacga 1140 ggccttgatc tcctgttctg ggagcaagga ggattatgca aagcattaca agaacagtgc 1200 cgttttccga atattaccaa ttcccatgtc ccaatactac aagaaagacc cccccttgag 1260 aatcgagtcc tgactggctg gggccttaac tgggaccttg gcctctcaca gtgggctcga 1320 gaggccttac aaactggaat cacccttgtt gcgctactcc ttcttgttat ccttgcagga 1380 ccatgcatcc tccgtcagct acgacacctc ccctcgcgcg tcagataccc ccattactct 1440 cttataaaac ctgagtcatc cctgtaa 1467 <210> 446 <211> 688 <212> PRT <213> Betaretrovirus Mouse mammary tumor virus <400> 446 Met Pro Lys His Gln Ser Gly Ser Pro Thr Asp Ser Ser Asp Leu Leu 1 5 10 15 Leu Ser Gly Lys Lys Gln Arg Pro His Leu Ala Leu Arg Arg Lys Arg 20 25 30 Arg Arg Glu Met Arg Lys Ile Asn Arg Lys Val Pro Arg Met Asn Leu 35 40 45 Val Pro Ile Lys Glu Lys Thr Ala Trp Gln His Leu Gln Ala Leu Ile 50 55 60 Ser Glu Ala Glu Glu Val Leu Lys Thr Ser Gln Thr Pro Gln Thr Ser 65 70 75 80 Leu Thr Leu Phe Leu Ala Leu Leu Ser Val Leu Gly Pro Pro Pro Val 85 90 95 Thr Gly Glu Ser Tyr Trp Ala Tyr Leu Pro Lys Pro Pro Ile Leu His 100 105 110 Pro Val Gly Trp Gly Ser Thr Asp Pro Ile Arg Val Leu Thr Asn Gln 115 120 125 Thr Met Tyr Leu Gly Gly Ser Pro Asp Phe His Gly Phe Arg Asn Met 130 135 140 Ser Gly Asn Val His Phe Glu Gly Lys Ser Asp Thr Leu Pro Ile Cys 145 150 155 160 Leu Ser Phe Ser Phe Ser Thr Pro Thr Gly Cys Phe Gln Val Asp Lys 165 170 175 Gln Val Phe Leu Ser Asp Thr Pro Thr Val Asp Asn Asn Lys Pro Gly 180 185 190 Gly Lys Gly Asp Lys Arg Arg Met Trp Glu Leu Trp Leu Thr Thr Leu 195 200 205 Gly Asn Ser Gly Ala Asn Thr Lys Leu Val Pro Ile Lys Lys Lys Leu 210 215 220 Pro Pro Lys Tyr Pro His Cys Gln Ile Ala Phe Lys Lys Asp Ala Phe 225 230 235 240 Trp Glu Gly Asp Glu Ser Ala Pro Pro Arg Trp Leu Pro Cys Ala Phe 245 250 255 Pro Asp Gln Gly Val Ser Phe Ser Pro Lys Gly Ala Leu Gly Leu Leu 260 265 270 Trp Asp Phe Ser Leu Pro Ser Pro Ser Val Asp Gln Ser Asp Gln Ile 275 280 285 Lys Ser Lys Lys Asn Leu Phe Gly Asn Tyr Thr Pro Pro Val Asn Lys 290 295 300 Glu Val His Arg Trp Tyr Glu Ala Gly Trp Val Glu Pro Thr Trp Phe 305 310 315 320 Trp Glu Asn Ser Pro Lys Asp Pro Asn Asp Arg Asp Phe Thr Ala Leu 325 330 335 Val Pro His Thr Glu Leu Phe Arg Leu Val Ala Ala Ser Arg His Leu 340 345 350 Ile Leu Lys Arg Pro Gly Phe Gln Glu His Glu Met Ile Pro Thr Ser 355 360 365 Ala Cys Val Thr Tyr Pro Tyr Ala Ile Leu Leu Gly Leu Pro Gln Leu 370 375 380 Ile Asp Ile Glu Lys Arg Gly Ser Thr Phe His Ile Ser Cys Ser Ser 385 390 395 400 Cys Arg Leu Thr Asn Cys Leu Asp Ser Ser Ala Tyr Asp Tyr Ala Ala 405 410 415 Ile Ile Val Lys Arg Pro Pro Tyr Val Leu Leu Pro Val Asp Ile Gly 420 425 430 Asp Glu Pro Trp Phe Asp Asp Ser Ala Ile Gln Thr Phe Arg Tyr Ala 435 440 445 Thr Asp Leu Ile Arg Ala Lys Arg Phe Val Ala Ala Ile Ile Leu Gly 450 455 460 Ile Ser Ala Leu Ile Ala Ile Ile Thr Ser Phe Ala Val Ala Thr Thr 465 470 475 480 Ala Leu Val Lys Glu Met Gln Thr Ala Thr Phe Val Asn Asn Leu His 485 490 495 Arg Asn Val Thr Leu Ala Leu Ser Glu Gln Arg Ile Ile Asp Leu Lys 500 505 510 Leu Glu Ala Arg Leu Asn Ala Leu Glu Glu Val Val Leu Glu Leu Gly 515 520 525 Gln Asp Val Ala Asn Leu Lys Thr Arg Met Ser Thr Arg Cys His Ala 530 535 540 Asn Tyr Asp Phe Ile Cys Val Thr Pro Leu Pro Tyr Asn Ala Thr Glu 545 550 555 560 Asn Trp Glu Arg Thr Arg Ala His Leu Leu Gly Ile Trp Asn Asp Asn 565 570 575 Glu Ile Ser Tyr Asn Ile Gln Glu Leu Thr Asn Leu Ile Ser Asp Met 580 585 590 Ser Lys Gln His Ile Asp Ala Val Asp Leu Ser Gly Leu Ala Gln Ser 595 600 605 Phe Ala Asn Gly Val Lys Ala Leu Asn Pro Leu Asp Trp Thr Gln Tyr 610 615 620 Phe Ile Phe Ile Gly Val Gly Ala Leu Leu Leu Val Ile Val Leu Met 625 630 635 640 Ile Phe Pro Ile Val Phe Gln Cys Leu Ala Lys Ser Leu Asp Gln Val 645 650 655 Gln Ser Asp Leu Asn Val Leu Leu Leu Lys Lys Lys Lys Gly Gly Asn 660 665 670 Ala Ala Pro Ala Ala Glu Met Val Glu Leu Pro Arg Val Ser Tyr Thr 675 680 685 <210> 447 <211> 1467 <212> DNA <213> Deltaretrovirus Human T-lymphotropic virus 1 <400> 447 atgggtaagt ttctcgccac tttgatttta ttcttccagt tctgccccct catcttcggt 60 gattacagcc ccagctgctg tactctcaca attggagtct cctcatacca ctctaaaccc 120 tgcaatcctg cccagccagt ttgttcgtgg accctcgacc tgctggccct ttcagcagat 180 caggccctac agcccccctg ccctaaccta gtaagttact ccagctacca tgccacctat 240 tccctatatc tattccctca ttggactaag aagccaaacc gaaatggcgg aggctattat 300 tcagcctctt attcagaccc ttgttcctta aagtgcccat acctggggtg ccaatcatgg 360 acctgcccct atacaggagc cgtctccagc ccctactgga agtttcaaca cgatgtcaat 420 tttactcaag aagtttcacg cctcaatatt aatctccatt tttcaaaatg cggttttccc 480 ttctcccttc tagtcgacgc tccaggatat gaccccatct ggttccttaa taccgaaccc 540 agccaactgc ctcccaccgc ccctcctcta ctcccccact ctaacctaga ccacatcctc 600 gagccctcta taccatggaa atcaaaactc ctgacccttg tccagttaac cctacaaagc 660 actaattata cttgcattgt ctgtatcgat cgtgccagcc tctccacttg gcacgtccta 720 tactctccca acgtctctgt tccatcctct tcttctaccc ccctccttta cccatcgtta 780 gcgcttccag ccccccacct gacgttacca tttaactgga cccactgctt tgacccccag 840 attcaagcta tagtctcctc cccctgtcat aactccctca tcctgccccc cttttccttg 900 tcacctgttc ccaccctagg atcccgctcc cgccgagcgg taccggtggc ggtctggctt 960 gtctccgccc tggccatggg agccggagtg gctggcggga ttaccggctc catgtccctc 1020 gcctcaggaa agagcctcct acatgaggtg gacaaagata tttcccagtt aactcaagca 1080 atagtcaaaa accacaaaaa tctactcaaa attgcgcagt atgctgccca gaacagacga 1140 ggccttgatc tcctgttctg ggagcaagga ggattatgca aagcattaca agaacagtgc 1200 cgttttccga atattaccaa ttcccatgtc ccaatactac aagaaagacc cccccttgag 1260 aatcgagtcc tgactggctg gggccttaac tgggaccttg gcctctcaca gtgggctcga 1320 gaggccttac aaactggaat cacccttgtt gcgctactcc ttcttgttat ccttgcagga 1380 ccatgcatcc tccgtcagct acgacacctc ccctcgcgcg tcagataccc ccattactct 1440 cttataaaac ctgagtcatc cctgtaa 1467 <210> 448 <211> 488 <212> PRT <213> Deltaretrovirus Human T-lymphotropic virus 1 <400> 448 Met Gly Lys Phe Leu Ala Thr Leu Ile Leu Phe Phe Gln Phe Cys Pro 1 5 10 15 Leu Ile Phe Gly Asp Tyr Ser Pro Ser Cys Cys Thr Leu Thr Ile Gly 20 25 30 Val Ser Ser Tyr His Ser Lys Pro Cys Asn Pro Ala Gln Pro Val Cys 35 40 45 Ser Trp Thr Leu Asp Leu Leu Ala Leu Ser Ala Asp Gln Ala Leu Gln 50 55 60 Pro Pro Cys Pro Asn Leu Val Ser Tyr Ser Ser Tyr His Ala Thr Tyr 65 70 75 80 Ser Leu Tyr Leu Phe Pro His Trp Thr Lys Lys Pro Asn Arg Asn Gly 85 90 95 Gly Gly Tyr Tyr Ser Ala Ser Tyr Ser Asp Pro Cys Ser Leu Lys Cys 100 105 110 Pro Tyr Leu Gly Cys Gln Ser Trp Thr Cys Pro Tyr Thr Gly Ala Val 115 120 125 Ser Ser Pro Tyr Trp Lys Phe Gln His Asp Val Asn Phe Thr Gln Glu 130 135 140 Val Ser Arg Leu Asn Ile Asn Leu His Phe Ser Lys Cys Gly Phe Pro 145 150 155 160 Phe Ser Leu Leu Val Asp Ala Pro Gly Tyr Asp Pro Ile Trp Phe Leu 165 170 175 Asn Thr Glu Pro Ser Gln Leu Pro Pro Thr Ala Pro Pro Leu Leu Pro 180 185 190 His Ser Asn Leu Asp His Ile Leu Glu Pro Ser Ile Pro Trp Lys Ser 195 200 205 Lys Leu Leu Thr Leu Val Gln Leu Thr Leu Gln Ser Thr Asn Tyr Thr 210 215 220 Cys Ile Val Cys Ile Asp Arg Ala Ser Leu Ser Thr Trp His Val Leu 225 230 235 240 Tyr Ser Pro Asn Val Ser Val Pro Ser Ser Ser Ser Thr Pro Leu Leu 245 250 255 Tyr Pro Ser Leu Ala Leu Pro Ala Pro His Leu Thr Leu Pro Phe Asn 260 265 270 Trp Thr His Cys Phe Asp Pro Gln Ile Gln Ala Ile Val Ser Ser Pro 275 280 285 Cys His Asn Ser Leu Ile Leu Pro Pro Phe Ser Leu Ser Pro Val Pro 290 295 300 Thr Leu Gly Ser Arg Ser Arg Arg Ala Val Pro Val Ala Val Trp Leu 305 310 315 320 Val Ser Ala Leu Ala Met Gly Ala Gly Val Ala Gly Gly Ile Thr Gly 325 330 335 Ser Met Ser Leu Ala Ser Gly Lys Ser Leu Leu His Glu Val Asp Lys 340 345 350 Asp Ile Ser Gln Leu Thr Gln Ala Ile Val Lys Asn His Lys Asn Leu 355 360 365 Leu Lys Ile Ala Gln Tyr Ala Ala Gln Asn Arg Arg Gly Leu Asp Leu 370 375 380 Leu Phe Trp Glu Gln Gly Gly Leu Cys Lys Ala Leu Gln Glu Gln Cys 385 390 395 400 Arg Phe Pro Asn Ile Thr Asn Ser His Val Pro Ile Leu Gln Glu Arg 405 410 415 Pro Pro Leu Glu Asn Arg Val Leu Thr Gly Trp Gly Leu Asn Trp Asp 420 425 430 Leu Gly Leu Ser Gln Trp Ala Arg Glu Ala Leu Gln Thr Gly Ile Thr 435 440 445 Leu Val Ala Leu Leu Leu Leu Val Ile Leu Ala Gly Pro Cys Ile Leu 450 455 460 Arg Gln Leu Arg His Leu Pro Ser Arg Val Arg Tyr Pro His Tyr Ser 465 470 475 480 Leu Ile Lys Pro Glu Ser Ser Leu 485 <210> 449 <211> 1698 <212> DNA <213> Unknown <220> <223> RD114 Endogenous Feline Retrovirus <400> 449 atgaaactcc caacaggaat ggtcatttta tgtagcctaa taatagttcg ggcagggttt 60 gacgaccccc gcaaggctat cgcattagta caaaaacaac atggtaaacc atgcgaatgc 120 agcggagggc aggtatccga ggccccaccg aactccatcc aacaggtaac ttgcccaggc 180 aagacggcct acttaatgac caaccaaaaa tggaaatgca gagtcactcc aaaaaatctc 240 acccctagcg ggggagaact ccagaactgc ccctgtaaca ctttccagga ctcgatgcac 300 agttcttgtt atactgaata ccggcaatgc agggcgaata ataagacata ctacacggcc 360 accttgctta aaatacggtc tgggagcctc aacgaggtac agatattaca aaaccccaat 420 cagctcctac agtccccttg taggggctct ataaatcagc ccgtttgctg gagtgccaca 480 gcccccatcc atatctccga tggtggagga cccctcgata ctaagagagt gtggacagtc 540 caaaaaaggc tagaacaaat tcataaggct atgcatcctg aacttcaata ccacccctta 600 gccctgccca aagtcagaga tgaccttagc cttgatgcac ggacttttga tatcctgaat 660 accactttta ggttactcca gatgtccaat tttagccttg cccaagattg ttggctctgt 720 ttaaaactag gtacccctac ccctcttgcg atacccactc cctctttaac ctactcccta 780 gcagactccc tagcgaatgc ctcctgtcag attatacctc ccctcttggt tcaaccgatg 840 cagttctcca actcgtcctg tttatcttcc cctttcatta acgatacgga acaaatagac 900 ttaggtgcag tcacctttac taactgcacc tctgtagcca atgtcagtag tcctttatgt 960 gccctaaacg ggtcagtctt cctctgtgga aataacatgg catacaccta tttaccccaa 1020 aactggacag gactttgcgt ccaagcctcc ctcctccccg acattgacat catcccgggg 1080 gatgagccag tccccattcc tgccattgat cattatatac atagacctaa acgagctgta 1140 cagttcatcc ctttactagc tggactggga atcaccgcag cattcaccac cggagctaca 1200 ggcctaggtg tctccgtcac ccagtataca aaattatccc atcagttaat atctgatgtc 1260 caagtcttat ccggtaccat acaagattta caagaccagg tagactcgtt agctgaagta 1320 gttctccaaa ataggagggg actggaccta ctaacggcag aacaaggagg aatttgttta 1380 gccttacaag aaaaatgctg tttttatgct aacaagtcag gaattgtgag aaacaaaata 1440 agaaccctac aagaagaatt acaaaaacgc agggaaagcc tggcatccaa ccctctctgg 1500 accgggctgc agggctttct tccgtacctc ctacctctcc tgggacccct actcaccctc 1560 ctactcatac taaccattgg gccatgcgtt ttcagtcgcc tcatggcctt cattaatgat 1620 agacttaatg ttgtacatgc catggtgctg gcccagcaat accaagcact caaagctgag 1680 gaagaagctc aggattga 1698 <210> 450 <211> 565 <212> PRT <213> Unknown <220> <223> RD114 Endogenous Feline Retrovirus <400> 450 Met Lys Leu Pro Thr Gly Met Val Ile Leu Cys Ser Leu Ile Ile Val 1 5 10 15 Arg Ala Gly Phe Asp Asp Pro Arg Lys Ala Ile Ala Leu Val Gln Lys 20 25 30 Gln His Gly Lys Pro Cys Glu Cys Ser Gly Gly Gln Val Ser Glu Ala 35 40 45 Pro Pro Asn Ser Ile Gln Gln Val Thr Cys Pro Gly Lys Thr Ala Tyr 50 55 60 Leu Met Thr Asn Gln Lys Trp Lys Cys Arg Val Thr Pro Lys Asn Leu 65 70 75 80 Thr Pro Ser Gly Gly Glu Leu Gln Asn Cys Pro Cys Asn Thr Phe Gln 85 90 95 Asp Ser Met His Ser Ser Cys Tyr Thr Glu Tyr Arg Gln Cys Arg Ala 100 105 110 Asn Asn Lys Thr Tyr Tyr Thr Ala Thr Leu Leu Lys Ile Arg Ser Gly 115 120 125 Ser Leu Asn Glu Val Gln Ile Leu Gln Asn Pro Asn Gln Leu Leu Gln 130 135 140 Ser Pro Cys Arg Gly Ser Ile Asn Gln Pro Val Cys Trp Ser Ala Thr 145 150 155 160 Ala Pro Ile His Ile Ser Asp Gly Gly Gly Pro Leu Asp Thr Lys Arg 165 170 175 Val Trp Thr Val Gln Lys Arg Leu Glu Gln Ile His Lys Ala Met His 180 185 190 Pro Glu Leu Gln Tyr His Pro Leu Ala Leu Pro Lys Val Arg Asp Asp 195 200 205 Leu Ser Leu Asp Ala Arg Thr Phe Asp Ile Leu Asn Thr Thr Phe Arg 210 215 220 Leu Leu Gln Met Ser Asn Phe Ser Leu Ala Gln Asp Cys Trp Leu Cys 225 230 235 240 Leu Lys Leu Gly Thr Pro Thr Pro Leu Ala Ile Pro Thr Pro Ser Leu 245 250 255 Thr Tyr Ser Leu Ala Asp Ser Leu Ala Asn Ala Ser Cys Gln Ile Ile 260 265 270 Pro Pro Leu Leu Val Gln Pro Met Gln Phe Ser Asn Ser Ser Cys Leu 275 280 285 Ser Ser Pro Phe Ile Asn Asp Thr Glu Gln Ile Asp Leu Gly Ala Val 290 295 300 Thr Phe Thr Asn Cys Thr Ser Val Ala Asn Val Ser Ser Pro Leu Cys 305 310 315 320 Ala Leu Asn Gly Ser Val Phe Leu Cys Gly Asn Asn Met Ala Tyr Thr 325 330 335 Tyr Leu Pro Gln Asn Trp Thr Gly Leu Cys Val Gln Ala Ser Leu Leu 340 345 350 Pro Asp Ile Asp Ile Ile Pro Gly Asp Glu Pro Val Pro Ile Pro Ala 355 360 365 Ile Asp His Tyr Ile His Arg Pro Lys Arg Ala Val Gln Phe Ile Pro 370 375 380 Leu Leu Ala Gly Leu Gly Ile Thr Ala Ala Phe Thr Thr Gly Ala Thr 385 390 395 400 Gly Leu Gly Val Ser Val Thr Gln Tyr Thr Lys Leu Ser His Gln Leu 405 410 415 Ile Ser Asp Val Gln Val Leu Ser Gly Thr Ile Gln Asp Leu Gln Asp 420 425 430 Gln Val Asp Ser Leu Ala Glu Val Val Leu Gln Asn Arg Arg Gly Leu 435 440 445 Asp Leu Leu Thr Ala Glu Gln Gly Gly Ile Cys Leu Ala Leu Gln Glu 450 455 460 Lys Cys Cys Phe Tyr Ala Asn Lys Ser Gly Ile Val Arg Asn Lys Ile 465 470 475 480 Arg Thr Leu Gln Glu Glu Leu Gln Lys Arg Arg Glu Ser Leu Ala Ser 485 490 495 Asn Pro Leu Trp Thr Gly Leu Gln Gly Phe Leu Pro Tyr Leu Leu Pro 500 505 510 Leu Leu Gly Pro Leu Leu Thr Leu Leu Leu Ile Leu Thr Ile Gly Pro 515 520 525 Cys Val Phe Ser Arg Leu Met Ala Phe Ile Asn Asp Arg Leu Asn Val 530 535 540 Val His Ala Met Val Leu Ala Gln Gln Tyr Gln Ala Leu Lys Ala Glu 545 550 555 560 Glu Glu Ala Gln Asp 565 <210> 451 <211> 2058 <212> DNA <213> Gammaretrovirus Gibbon ape leukemia virus <400> 451 atggtattgc tgcctgggtc catgcttctc acctcaagcc tgcaccacct tcggcaccag 60 atgagtcctg ggagttggaa aagactgatc atcctcttaa gctgcgtatt cggcggcggc 120 ggaacgagtc tgcaaaataa gaacccccac cagcctatga ccctcacctg gcaggtactg 180 tcccaaactg gagacgttgt ctgggataca aaggcagtcc agcccccttg gacttggtgg 240 cccacactta aacctgatat atgtgccttg gcggctggtc ttgagtcctg ggatatcccg 300 ggaaccgatg tctcgtcctc taaacgagtc agacctccgg actcagacta tactgccgct 360 tataaacaaa tcacctgggg agccataggg tgcagctacc ctcgggctag gaccagaatg 420 gcaagctcca ccttctacgt atgtccccgg gatggccgga ccccttcaga agctagaagg 480 tgcggggggc tagaatccct atactgtaaa gaatggaatt gtgaaaccac agggaccggt 540 tattggctac ccaagtcctc aaaagacctc ataacgggta gatgggatca aaatagcaaa 600 tgggatcaaa aatttcaaaa gtgtcaccag accggctggt gtaaccccct taaaatagat 660 ttcacagaca caggaaaatc ctccagggat tggatagtag gaaaaacctg gggattaaga 720 ttctatgtgc atggacatcc aggcgtccag ttcaccattc gcttaaaaat caccagcatg 780 acagctgtgg cagtcggccc cgatcccgtc cttgtggaac aaggacctcc cagaagggcc 840 ctcgctctcc cacctcctct ccccccaagg gaagcgccac cgccacctct ccccgactcc 900 aactccacaa ccctggcgac tagtgcacaa actcccacgg tgggaaaaac aattgttacc 960 ctaaacactc cgcctcccac cacaggcgac agactcttta acctcgtgca gggggccttc 1020 ctaaccctga atgctaccaa cccaggggcc actaagtcat gctggctttg tttggccatg 1080 ggtcccccct attatgaagc aataacctca ttgggggagg tcgcttattc caccagccag 1140 gaccggtgcc actggggaac ccaaggaaag cttaccctca ctgaggtctc aggacacggg 1200 ttatgcatag gaaaggtgcc cttcacccat cagcatctct gcaatcagac cctatccatc 1260 aattcctccg agggccatca gtatctgctc ccctccaatc atagctggtg ggcttgcagc 1320 actggcctca ccccttgcct ctctacctca gtttttaatc agagtcgaga tttctgtatc 1380 caggtccagc tgatccctcg catctattac tatcctgaag aagttttgtt acaggcctat 1440 gacgattctc accccaggcc taaaagagaa gctgtctcac ttaccctagc tgttttactg 1500 gggttgggga tcacggcggg tataggtact ggttcaaccg ccttaattaa aggacccata 1560 gacctccaac aaggcctgac cagcctccag atcgccatag atgctgacct ccgggccctc 1620 caggactcag tcagcaagct ggaggactca ctgacctccc tgtccgaggt agtactccaa 1680 aataggagag gccttgactt gctgtttcta aaggaaggag gcctctgtgc ggccctaaaa 1740 gaagagtgct gtttttatat agaccactca ggtgcagtac gagactccat gaaaaaactc 1800 aaagaaaaac tagataaaag acagttagag cgccagaaaa accaaaactg gtatgaaggg 1860 tggttcaata actccccttg gttcactacc ctactatcaa ccattgccgg gcccctgtta 1920 ctcctccttc tattgctcat cctcgggccc tgcatcatca ataagttagt tcaattcatc 1980 aatgatagag taagtgcagt taaaattttg gtccttagga caaaatatca ggccctagat 2040 aacgaagata acctttaa 2058 <210> 452 <211> 685 <212> PRT <213> Gammaretrovirus Gibbon ape leukemia virus <400> 452 Met Val Leu Leu Pro Gly Ser Met Leu Leu Thr Ser Ser Leu His His 1 5 10 15 Leu Arg His Gln Met Ser Pro Gly Ser Trp Lys Arg Leu Ile Ile Leu 20 25 30 Leu Ser Cys Val Phe Gly Gly Gly Gly Thr Ser Leu Gln Asn Lys Asn 35 40 45 Pro His Gln Pro Met Thr Leu Thr Trp Gln Val Leu Ser Gln Thr Gly 50 55 60 Asp Val Val Trp Asp Thr Lys Ala Val Gln Pro Pro Trp Thr Trp Trp 65 70 75 80 Pro Thr Leu Lys Pro Asp Ile Cys Ala Leu Ala Ala Gly Leu Glu Ser 85 90 95 Trp Asp Ile Pro Gly Thr Asp Val Ser Ser Ser Lys Arg Val Arg Pro 100 105 110 Pro Asp Ser Asp Tyr Thr Ala Ala Tyr Lys Gln Ile Thr Trp Gly Ala 115 120 125 Ile Gly Cys Ser Tyr Pro Arg Ala Arg Thr Arg Met Ala Ser Ser Thr 130 135 140 Phe Tyr Val Cys Pro Arg Asp Gly Arg Thr Pro Ser Glu Ala Arg Arg 145 150 155 160 Cys Gly Gly Leu Glu Ser Leu Tyr Cys Lys Glu Trp Asn Cys Glu Thr 165 170 175 Thr Gly Thr Gly Tyr Trp Leu Pro Lys Ser Ser Lys Asp Leu Ile Thr 180 185 190 Gly Arg Trp Asp Gln Asn Ser Lys Trp Asp Gln Lys Phe Gln Lys Cys 195 200 205 His Gln Thr Gly Trp Cys Asn Pro Leu Lys Ile Asp Phe Thr Asp Thr 210 215 220 Gly Lys Ser Ser Arg Asp Trp Ile Val Gly Lys Thr Trp Gly Leu Arg 225 230 235 240 Phe Tyr Val His Gly His Pro Gly Val Gln Phe Thr Ile Arg Leu Lys 245 250 255 Ile Thr Ser Met Thr Ala Val Ala Val Gly Pro Asp Pro Val Leu Val 260 265 270 Glu Gln Gly Pro Pro Arg Arg Ala Leu Ala Leu Pro Pro Pro Leu Pro 275 280 285 Pro Arg Glu Ala Pro Pro Pro Pro Leu Pro Asp Ser Asn Ser Thr Thr 290 295 300 Leu Ala Thr Ser Ala Gln Thr Pro Thr Val Gly Lys Thr Ile Val Thr 305 310 315 320 Leu Asn Thr Pro Pro Pro Thr Thr Gly Asp Arg Leu Phe Asn Leu Val 325 330 335 Gln Gly Ala Phe Leu Thr Leu Asn Ala Thr Asn Pro Gly Ala Thr Lys 340 345 350 Ser Cys Trp Leu Cys Leu Ala Met Gly Pro Pro Tyr Tyr Glu Ala Ile 355 360 365 Thr Ser Leu Gly Glu Val Ala Tyr Ser Thr Ser Gln Asp Arg Cys His 370 375 380 Trp Gly Thr Gln Gly Lys Leu Thr Leu Thr Glu Val Ser Gly His Gly 385 390 395 400 Leu Cys Ile Gly Lys Val Pro Phe Thr His Gln His Leu Cys Asn Gln 405 410 415 Thr Leu Ser Ile Asn Ser Ser Glu Gly His Gln Tyr Leu Leu Pro Ser 420 425 430 Asn His Ser Trp Trp Ala Cys Ser Thr Gly Leu Thr Pro Cys Leu Ser 435 440 445 Thr Ser Val Phe Asn Gln Ser Arg Asp Phe Cys Ile Gln Val Gln Leu 450 455 460 Ile Pro Arg Ile Tyr Tyr Tyr Pro Glu Glu Val Leu Leu Gln Ala Tyr 465 470 475 480 Asp Asp Ser His Pro Arg Pro Lys Arg Glu Ala Val Ser Leu Thr Leu 485 490 495 Ala Val Leu Leu Gly Leu Gly Ile Thr Ala Gly Ile Gly Thr Gly Ser 500 505 510 Thr Ala Leu Ile Lys Gly Pro Ile Asp Leu Gln Gln Gly Leu Thr Ser 515 520 525 Leu Gln Ile Ala Ile Asp Ala Asp Leu Arg Ala Leu Gln Asp Ser Val 530 535 540 Ser Lys Leu Glu Asp Ser Leu Thr Ser Leu Ser Glu Val Val Leu Gln 545 550 555 560 Asn Arg Arg Gly Leu Asp Leu Leu Phe Leu Lys Glu Gly Gly Leu Cys 565 570 575 Ala Ala Leu Lys Glu Glu Cys Cys Phe Tyr Ile Asp His Ser Gly Ala 580 585 590 Val Arg Asp Ser Met Lys Lys Leu Lys Glu Lys Leu Asp Lys Arg Gln 595 600 605 Leu Glu Arg Gln Lys Asn Gln Asn Trp Tyr Glu Gly Trp Phe Asn Asn 610 615 620 Ser Pro Trp Phe Thr Thr Leu Leu Ser Thr Ile Ala Gly Pro Leu Leu 625 630 635 640 Leu Leu Leu Leu Leu Leu Ile Leu Gly Pro Cys Ile Ile Asn Lys Leu 645 650 655 Val Gln Phe Ile Asn Asp Arg Val Ser Ala Val Lys Ile Leu Val Leu 660 665 670 Arg Thr Lys Tyr Gln Ala Leu Asp Asn Glu Asp Asn Leu 675 680 685 <210> 453 <211> 1998 <212> DNA <213> Gammaretrovirus Moloney Murine leukemia virus <400> 453 atggcgcgtt caacgctctc aaaacccctt aaaaataagg ttaacccgcg aggcccccta 60 atccccttaa ttcttctgat gctcagaggg gtcagtactg cttcgcccgg ctccagtcct 120 catcaagtct ataatatcac ctgggaggta accaatggag atcgggagac ggtatgggca 180 acttctggca accaccctct gtggacctgg tggcctgacc ttaccccaga tttatgtatg 240 ttagcccacc atggaccatc ttattggggg ctagaatatc aatccccttt ttcttctccc 300 ccggggcccc cttgttgctc agggggcagc agcccaggct gttccagaga ctgcgaagaa 360 cctttaacct ccctcacccc tcggtgcaac actgcctgga acagactcaa gctagaccag 420 acaactcata aatcaaatga gggattttat gtttgccccg ggccccaccg cccccgagaa 480 tccaagtcat gtgggggtcc agactccttc tactgtgcct attggggctg tgagacaacc 540 ggtagagctt actggaagcc ctcctcatca tgggatttca tcacagtaaa caacaatctc 600 acctctgacc aggctgtcca ggtatgcaaa gataataagt ggtgcaaccc cttagttatt 660 cggtttacag acgccgggag acgggttact tcctggacca caggacatta ctggggctta 720 cgtttgtatg tctccggaca agatccaggg cttacatttg ggatccgact cagataccaa 780 aatctaggac cccgcgtccc aatagggcca aaccccgttc tggcagacca acagccactc 840 tccaagccca aacctgttaa gtcgccttca gtcaccaaac cacccagtgg gactcctctc 900 tcccctaccc aacttccacc ggcgggaacg gaaaataggc tgctaaactt agtagacgga 960 gcctaccaag ccctcaacct caccagtcct gacaaaaccc aagagtgctg gttgtgtcta 1020 gtagcgggac ccccctacta cgaaggggtt gccgtcctgg gtacctactc caaccatacc 1080 tctgctccag ccaactgctc cgtggcctcc caacacaagt tgaccctgtc cgaagtgacc 1140 ggacagggac tctgcatagg agcagttccc aaaacacatc aggccctatg taataccacc 1200 cagacaagca gtcgagggtc ctattatcta gttgccccta caggtaccat gtgggcttgt 1260 agtaccgggc ttactccatg catctccacc accatactga accttaccac tgattattgt 1320 gttcttgtcg aactctggcc aagagtcacc tatcattccc ccagctatgt ttacggcctg 1380 tttgagagat ccaaccgaca caaaagagaa ccggtgtcgt taaccctggc cctattattg 1440 ggtggactaa ccatgggggg aattgccgct ggaataggaa cagggactac tgctctaatg 1500 gccactcagc aattccagca gctccaagcc gcagtacagg atgatctcag ggaggttgaa 1560 aaatcaatct ctaacctaga aaagtctctc acttccctgt ctgaagttgt cctacagaat 1620 cgaaggggcc tagacttgtt atttctaaaa gaaggagggc tgtgtgctgc tctaaaagaa 1680 gaatgttgct tctatgcgga ccacacagga ctagtgagag acagcatggc caaattgaga 1740 gagaggctta atcagagaca gaaactgttt gagtcaactc aaggatggtt tgagggactg 1800 tttaacagat ccccttggtt taccaccttg atatctacca ttatgggacc cctcattgta 1860 ctcctaatga ttttgctctt cggaccctgc attcttaatc gattagtcca atttgttaaa 1920 gacaggatat cagtggtcca ggctctagtt ttgactcaac aatatcacca gctgaagcct 1980 atagagtacg agccatag 1998 <210> 454 <211> 665 <212> PRT <213> Gammaretrovirus Moloney Murine leukemia virus <400> 454 Met Ala Arg Ser Thr Leu Ser Lys Pro Leu Lys Asn Lys Val Asn Pro 1 5 10 15 Arg Gly Pro Leu Ile Pro Leu Ile Leu Leu Met Leu Arg Gly Val Ser 20 25 30 Thr Ala Ser Pro Gly Ser Ser Pro His Gln Val Tyr Asn Ile Thr Trp 35 40 45 Glu Val Thr Asn Gly Asp Arg Glu Thr Val Trp Ala Thr Ser Gly Asn 50 55 60 His Pro Leu Trp Thr Trp Trp Pro Asp Leu Thr Pro Asp Leu Cys Met 65 70 75 80 Leu Ala His His Gly Pro Ser Tyr Trp Gly Leu Glu Tyr Gln Ser Pro 85 90 95 Phe Ser Ser Pro Pro Gly Pro Pro Cys Cys Ser Gly Gly Ser Ser Pro 100 105 110 Gly Cys Ser Arg Asp Cys Glu Glu Pro Leu Thr Ser Leu Thr Pro Arg 115 120 125 Cys Asn Thr Ala Trp Asn Arg Leu Lys Leu Asp Gln Thr Thr His Lys 130 135 140 Ser Asn Glu Gly Phe Tyr Val Cys Pro Gly Pro His Arg Pro Arg Glu 145 150 155 160 Ser Lys Ser Cys Gly Gly Pro Asp Ser Phe Tyr Cys Ala Tyr Trp Gly 165 170 175 Cys Glu Thr Thr Gly Arg Ala Tyr Trp Lys Pro Ser Ser Ser Trp Asp 180 185 190 Phe Ile Thr Val Asn Asn Asn Leu Thr Ser Asp Gln Ala Val Gln Val 195 200 205 Cys Lys Asp Asn Lys Trp Cys Asn Pro Leu Val Ile Arg Phe Thr Asp 210 215 220 Ala Gly Arg Arg Val Thr Ser Trp Thr Thr Gly His Tyr Trp Gly Leu 225 230 235 240 Arg Leu Tyr Val Ser Gly Gln Asp Pro Gly Leu Thr Phe Gly Ile Arg 245 250 255 Leu Arg Tyr Gln Asn Leu Gly Pro Arg Val Pro Ile Gly Pro Asn Pro 260 265 270 Val Leu Ala Asp Gln Gln Pro Leu Ser Lys Pro Lys Pro Val Lys Ser 275 280 285 Pro Ser Val Thr Lys Pro Pro Ser Gly Thr Pro Leu Ser Pro Thr Gln 290 295 300 Leu Pro Pro Ala Gly Thr Glu Asn Arg Leu Leu Asn Leu Val Asp Gly 305 310 315 320 Ala Tyr Gln Ala Leu Asn Leu Thr Ser Pro Asp Lys Thr Gln Glu Cys 325 330 335 Trp Leu Cys Leu Val Ala Gly Pro Pro Tyr Tyr Glu Gly Val Ala Val 340 345 350 Leu Gly Thr Tyr Ser Asn His Thr Ser Ala Pro Ala Asn Cys Ser Val 355 360 365 Ala Ser Gln His Lys Leu Thr Leu Ser Glu Val Thr Gly Gln Gly Leu 370 375 380 Cys Ile Gly Ala Val Pro Lys Thr His Gln Ala Leu Cys Asn Thr Thr 385 390 395 400 Gln Thr Ser Ser Arg Gly Ser Tyr Tyr Leu Val Ala Pro Thr Gly Thr 405 410 415 Met Trp Ala Cys Ser Thr Gly Leu Thr Pro Cys Ile Ser Thr Thr Ile 420 425 430 Leu Asn Leu Thr Thr Asp Tyr Cys Val Leu Val Glu Leu Trp Pro Arg 435 440 445 Val Thr Tyr His Ser Pro Ser Tyr Val Tyr Gly Leu Phe Glu Arg Ser 450 455 460 Asn Arg His Lys Arg Glu Pro Val Ser Leu Thr Leu Ala Leu Leu Leu 465 470 475 480 Gly Gly Leu Thr Met Gly Gly Ile Ala Ala Gly Ile Gly Thr Gly Thr 485 490 495 Thr Ala Leu Met Ala Thr Gln Gln Phe Gln Gln Leu Gln Ala Ala Val 500 505 510 Gln Asp Asp Leu Arg Glu Val Glu Lys Ser Ile Ser Asn Leu Glu Lys 515 520 525 Ser Leu Thr Ser Leu Ser Glu Val Val Leu Gln Asn Arg Arg Gly Leu 530 535 540 Asp Leu Leu Phe Leu Lys Glu Gly Gly Leu Cys Ala Ala Leu Lys Glu 545 550 555 560 Glu Cys Cys Phe Tyr Ala Asp His Thr Gly Leu Val Arg Asp Ser Met 565 570 575 Ala Lys Leu Arg Glu Arg Leu Asn Gln Arg Gln Lys Leu Phe Glu Ser 580 585 590 Thr Gln Gly Trp Phe Glu Gly Leu Phe Asn Arg Ser Pro Trp Phe Thr 595 600 605 Thr Leu Ile Ser Thr Ile Met Gly Pro Leu Ile Val Leu Leu Met Ile 610 615 620 Leu Leu Phe Gly Pro Cys Ile Leu Asn Arg Leu Val Gln Phe Val Lys 625 630 635 640 Asp Arg Ile Ser Val Val Gln Ala Leu Val Leu Thr Gln Gln Tyr His 645 650 655 Gln Leu Lys Pro Ile Glu Tyr Glu Pro 660 665 <210> 455 <211> 1692 <212> DNA <213> Gammaretrovirus Baboon Endogenous Virus <400> 455 atgggattca caacaaagat aatcttctta tacaacctag tactggtcta cgcggggttt 60 gacgaccctc gcaaagccat agaactagta caaaagcgat atggccgacc atgcgattgc 120 agcggaggac aagtgtccga gcccccgtca gacagggtca gtcaagtgac ttgctcaggc 180 aagacagctt acttaatgcc cgaccaaaga tggaaatgta agtcaattcc aaaagacacc 240 tccccaagcg ggccactcca agagtgcccc tgtaattctt accagtcctc agtacacagt 300 tcttgttata cctcatacca acaatgcaga tcaggcaata agacatatta tacggctact 360 ctgctaaaaa cacaaactgg gggcaccagt gatgtacaag tattaggatc caccaacaaa 420 cttatacaat ctccctgtaa tggcataaaa gggcagtcta tttgctggag cactacagct 480 cctatccacg tctctgatgg aggaggtcca ttagacacca caagaattaa aagtgttcag 540 agaaaactgg aagaaattca taaagcccta tatcctgaac ttcagtatca ccctttggcc 600 atacctaagg ttagagataa cctcatggtc gatgcccaga ctttaaacat tctcaatgcc 660 acttacaact tactcctaat gtccaacacg agcctagtgg acgactgttg gctttgttta 720 aaattaggtc cccctactcc cctcgcaata cctaacttcc tattatccta cgtgactcgc 780 tcctcggata atatctcttg tttaataatt cccccccttc tagttcaacc gatgcagttt 840 tccaattcat cttgcctctt ttccccctcc tacaacagta cagaagaaat agatctaggc 900 catgttgcct tcagcaactg tacctccata accaatgtca ccggtcccat atgcgctgta 960 aatggttcgg tctttctctg tggcaataac atggcataca cttatctacc cacgaactgg 1020 acggggcttt gcgtcctagc aactctcctc cccgacattg acatcattcc cggagatgaa 1080 ccggtcccca tccctgctat tgatcatttt atatatagac ctaaacgggc catacagttt 1140 attcctttac tagcagggct agggatcacc gcagccttca caacaggagc tacaggccta 1200 ggtgtctctg tgacccaata tacaaaatta tctaatcagc taatttctga tgtacaaatc 1260 ttatctagca ccatacaaga tctgcaagat caagtagact cattagccga agtggttctc 1320 cagaacagaa gggggctaga tctacttaca gcagaacaag gaggaatctg tttagccctg 1380 caagaaaaat gctgctttta tgttaacaag tcagggattg tgagagacaa aataaaaacc 1440 ttacaagaag aactagaaag acgtagaaaa gatctagctt ccaacccact ttggactggg 1500 cttcaagggc tcctccctta cctcctgccc tttcttggcc ctctacttac cctcctgctc 1560 ttactcacca ttgggccgtg catttttaac cgtctaaccg cttttattaa tgataagtta 1620 aacataatac acgctatggt gctaacccaa cagtatcagg tgctcagaac cgatgaagaa 1680 gctcaagatt ga 1692 <210> 456 <211> 563 <212> PRT <213> Gammaretrovirus Baboon Endogenous Virus <400> 456 Met Gly Phe Thr Thr Lys Ile Ile Phe Leu Tyr Asn Leu Val Leu Val 1 5 10 15 Tyr Ala Gly Phe Asp Asp Pro Arg Lys Ala Ile Glu Leu Val Gln Lys 20 25 30 Arg Tyr Gly Arg Pro Cys Asp Cys Ser Gly Gly Gln Val Ser Glu Pro 35 40 45 Pro Ser Asp Arg Val Ser Gln Val Thr Cys Ser Gly Lys Thr Ala Tyr 50 55 60 Leu Met Pro Asp Gln Arg Trp Lys Cys Lys Ser Ile Pro Lys Asp Thr 65 70 75 80 Ser Pro Ser Gly Pro Leu Gln Glu Cys Pro Cys Asn Ser Tyr Gln Ser 85 90 95 Ser Val His Ser Ser Cys Tyr Thr Ser Tyr Gln Gln Cys Arg Ser Gly 100 105 110 Asn Lys Thr Tyr Tyr Thr Ala Thr Leu Leu Lys Thr Gln Thr Gly Gly 115 120 125 Thr Ser Asp Val Gln Val Leu Gly Ser Thr Asn Lys Leu Ile Gln Ser 130 135 140 Pro Cys Asn Gly Ile Lys Gly Gln Ser Ile Cys Trp Ser Thr Thr Ala 145 150 155 160 Pro Ile His Val Ser Asp Gly Gly Gly Pro Leu Asp Thr Thr Arg Ile 165 170 175 Lys Ser Val Gln Arg Lys Leu Glu Glu Ile His Lys Ala Leu Tyr Pro 180 185 190 Glu Leu Gln Tyr His Pro Leu Ala Ile Pro Lys Val Arg Asp Asn Leu 195 200 205 Met Val Asp Ala Gln Thr Leu Asn Ile Leu Asn Ala Thr Tyr Asn Leu 210 215 220 Leu Leu Met Ser Asn Thr Ser Leu Val Asp Asp Cys Trp Leu Cys Leu 225 230 235 240 Lys Leu Gly Pro Pro Thr Pro Leu Ala Ile Pro Asn Phe Leu Leu Ser 245 250 255 Tyr Val Thr Arg Ser Ser Asp Asn Ile Ser Cys Leu Ile Ile Pro Pro 260 265 270 Leu Leu Val Gln Pro Met Gln Phe Ser Asn Ser Ser Cys Leu Phe Ser 275 280 285 Pro Ser Tyr Asn Ser Thr Glu Glu Ile Asp Leu Gly His Val Ala Phe 290 295 300 Ser Asn Cys Thr Ser Ile Thr Asn Val Thr Gly Pro Ile Cys Ala Val 305 310 315 320 Asn Gly Ser Val Phe Leu Cys Gly Asn Asn Met Ala Tyr Thr Tyr Leu 325 330 335 Pro Thr Asn Trp Thr Gly Leu Cys Val Leu Ala Thr Leu Leu Pro Asp 340 345 350 Ile Asp Ile Ile Pro Gly Asp Glu Pro Val Pro Ile Pro Ala Ile Asp 355 360 365 His Phe Ile Tyr Arg Pro Lys Arg Ala Ile Gln Phe Ile Pro Leu Leu 370 375 380 Ala Gly Leu Gly Ile Thr Ala Ala Phe Thr Thr Gly Ala Thr Gly Leu 385 390 395 400 Gly Val Ser Val Thr Gln Tyr Thr Lys Leu Ser Asn Gln Leu Ile Ser 405 410 415 Asp Val Gln Ile Leu Ser Ser Thr Ile Gln Asp Leu Gln Asp Gln Val 420 425 430 Asp Ser Leu Ala Glu Val Val Leu Gln Asn Arg Arg Gly Leu Asp Leu 435 440 445 Leu Thr Ala Glu Gln Gly Gly Ile Cys Leu Ala Leu Gln Glu Lys Cys 450 455 460 Cys Phe Tyr Val Asn Lys Ser Gly Ile Val Arg Asp Lys Ile Lys Thr 465 470 475 480 Leu Gln Glu Glu Leu Glu Arg Arg Arg Lys Asp Leu Ala Ser Asn Pro 485 490 495 Leu Trp Thr Gly Leu Gln Gly Leu Leu Pro Tyr Leu Leu Pro Phe Leu 500 505 510 Gly Pro Leu Leu Thr Leu Leu Leu Leu Leu Thr Ile Gly Pro Cys Ile 515 520 525 Phe Asn Arg Leu Thr Ala Phe Ile Asn Asp Lys Leu Asn Ile Ile His 530 535 540 Ala Met Val Leu Thr Gln Gln Tyr Gln Val Leu Arg Thr Asp Glu Glu 545 550 555 560 Ala Gln Asp <210> 457 <211> 2958 <212> DNA <213> Spumavirus Human Foamy Virus <400> 457 atgacactgc aacaatggat catttggaaa aaaatgaata aagcgcatga ggcacttcaa 60 aatacaacaa ctgtgactga acagcagaag gaacaaatta tactggacat tcaaaatgaa 120 gaagtacaac caactaggag agataaattt agatatctgc tttatacttg ttgtgctact 180 agctcaagag tattggcctg gatgttttta gtttgtatat tgttaatcat tgttttggtt 240 tcatgctttg tgactatatc cagaatacaa tggaataagg atattcaggt attaggacct 300 gtaatagact ggaatgttac tcaaagagct gtttatcaac ccttacagac tagaaggatt 360 gcacgttccc ttagaatgca gcatcctgtt ccaaaatatg tggaggtaaa tatgactagt 420 attccacaag gtgtatacta tgaaccccat ccggaaccca tagtggtgaa ggagagggtc 480 ctaggtcttt ctcaaattct gatgattaat tcagaaaaca ttgctaataa tgctaatttg 540 acacaagaag taaagaagtt gttaactgaa atggttaatg aagaaatgca aagtttgtca 600 gatgtaatga ttgactttga aattccttta ggagaccctc gtgatcaaga acaatatata 660 catagaaaat gctatcaaga atttgcaaat tgttatttag taaaatataa agaacccaaa 720 ccgtggccta aggagggcct tatagctgat caatgcccat taccaggtta ccatgctgga 780 ttaacctata atagacagtc tatttgggat tactatatta aagtggagag tattagacct 840 gcaaattgga caacaaagag taaatatgga caagctagac taggaagttt ttatattcct 900 agcagcctga gacaaatcaa tgttagtcat gtactattct gtagtgatca attatattct 960 aaatggtata atatagaaaa taccatagaa caaaacgagc ggtttctgct taataaacta 1020 aataacctta catctggaac ctcagtattg aagaaaagag ctcttccgaa ggattggagt 1080 tctcaaggta aaaatgctct gtttagagaa atcaatgtgt tagatatctg cagtaaacct 1140 gaatctgtaa tactattgaa tacttcatac tattccttct ctttatggga aggagattgt 1200 aattttacta aagatatgat ttctcagttg gttccagaat gtgatggatt ttataacaat 1260 tctaagtgga tgcatatgca tccatatgct tgtagattct ggagaagtaa gaagaatgaa 1320 aaagaagaaa ctaaatgtag agatggggaa actaagagat gtctgtatta tcctttatgg 1380 gacagtcccg aatctacata tgattttggt tatttagcat accaaaagaa ttttccttcc 1440 cctatctgta tagaacaaca gaaaattaga gatcaagatt atgaagtcta ttctttgtat 1500 caagaacgca aaatagcttc taaagcatat ggaattgata cagttttatt ctctctaaag 1560 aattttctta attatacagg aactcctgta aatgaaatgc ctaatgcaag agcttttgta 1620 ggcctaatag atcccaagtt tcctccttcc tatcccaatg ttactaggga acattatact 1680 tcctgtaata ataggaaaag aagaagtgtt gataataact atgctaagtt aaggtctatg 1740 gggtatgcac ttacaggagc agtgcaaacc ttatctcaaa tatcagatat taatgatgaa 1800 aacttacagc aaggaatata tttattaagg gatcatgtaa taaccttaat ggaagctaca 1860 ttgcatgata tatctgttat ggaaggaatg tttgctgtac aacatttgca tacacatttg 1920 aatcatttga agacaatgct tctagaaaga agaatagact ggacctatat gtctagtact 1980 tggctacaac aacaattaca gaaatctgat gatgagatga aagtaataaa gagaattgct 2040 agaagtttgg tatattatgt taaacaaacc catagttctc ccacagctac agcctgggag 2100 attggattat attatgaatt ggttatacct aaacatattt acttgaataa ttggaatgtt 2160 gtcaatatag gtcacttagt taaatcagct ggacaattga ctcatgtaac tatagctcat 2220 ccttatgaaa taatcaataa ggaatgtgta gagactatat atctgcatct tgaggactgc 2280 acaagacaag attatgtcat atgtgatgtg gtaaagatag tgcagccttg tggcaatagc 2340 tcagacacga gtgattgtcc tgtctgggct gaagctgtaa aagaaccatt tgtgcaagtc 2400 aatcctctga aaaacggaag ttatctggtt ttggcaagtt ccacagactg tcagatccca 2460 ccatatgttc ctagcatcgt gactgttaat gaaacaacgt catgctttgg actggacttt 2520 aaaaggccac tggttgcgga agaaagattg agctttgagc cacgactgcc aaatctacaa 2580 ctaagattac cacatttggt tggaattatt gcaaaaatca aagggataaa aatagaagtc 2640 acatcctctg gagaaagtat aaaagagcag attgaaagag caaaagctga gctccttcga 2700 ctggacattc acgagggaga tactcctgcc tggatacaac agctagctgc agcaacaaag 2760 gacgtctggc cagcagcagc ttctgctcta caaggaattg gtaacttttt atctgggact 2820 gcccaaggaa tatttggaac tgcctttagt ctcttgggat acttaaagcc tatcctaata 2880 ggagtagggg tcattctctt ggttattctt atatttaaga ttgtatcatg gattcctacg 2940 aaaaagaaga atcagtag 2958 <210> 458 <211> 985 <212> PRT <213> Spumavirus Human Foamy Virus <400> 458 Met Thr Leu Gln Gln Trp Ile Ile Trp Lys Lys Met Asn Lys Ala His 1 5 10 15 Glu Ala Leu Gln Asn Thr Thr Thr Val Thr Glu Gln Gln Lys Glu Gln 20 25 30 Ile Ile Leu Asp Ile Gln Asn Glu Glu Val Gln Pro Thr Arg Arg Asp 35 40 45 Lys Phe Arg Tyr Leu Leu Tyr Thr Cys Cys Ala Thr Ser Ser Arg Val 50 55 60 Leu Ala Trp Met Phe Leu Val Cys Ile Leu Leu Ile Ile Val Leu Val 65 70 75 80 Ser Cys Phe Val Thr Ile Ser Arg Ile Gln Trp Asn Lys Asp Ile Gln 85 90 95 Val Leu Gly Pro Val Ile Asp Trp Asn Val Thr Gln Arg Ala Val Tyr 100 105 110 Gln Pro Leu Gln Thr Arg Arg Ile Ala Arg Ser Leu Arg Met Gln His 115 120 125 Pro Val Pro Lys Tyr Val Glu Val Asn Met Thr Ser Ile Pro Gln Gly 130 135 140 Val Tyr Tyr Glu Pro His Pro Glu Pro Ile Val Val Lys Glu Arg Val 145 150 155 160 Leu Gly Leu Ser Gln Ile Leu Met Ile Asn Ser Glu Asn Ile Ala Asn 165 170 175 Asn Ala Asn Leu Thr Gln Glu Val Lys Lys Leu Leu Thr Glu Met Val 180 185 190 Asn Glu Glu Met Gln Ser Leu Ser Asp Val Met Ile Asp Phe Glu Ile 195 200 205 Pro Leu Gly Asp Pro Arg Asp Gln Glu Gln Tyr Ile His Arg Lys Cys 210 215 220 Tyr Gln Glu Phe Ala Asn Cys Tyr Leu Val Lys Tyr Lys Glu Pro Lys 225 230 235 240 Pro Trp Pro Lys Glu Gly Leu Ile Ala Asp Gln Cys Pro Leu Pro Gly 245 250 255 Tyr His Ala Gly Leu Thr Tyr Asn Arg Gln Ser Ile Trp Asp Tyr Tyr 260 265 270 Ile Lys Val Glu Ser Ile Arg Pro Ala Asn Trp Thr Thr Lys Ser Lys 275 280 285 Tyr Gly Gln Ala Arg Leu Gly Ser Phe Tyr Ile Pro Ser Ser Leu Arg 290 295 300 Gln Ile Asn Val Ser His Val Leu Phe Cys Ser Asp Gln Leu Tyr Ser 305 310 315 320 Lys Trp Tyr Asn Ile Glu Asn Thr Ile Glu Gln Asn Glu Arg Phe Leu 325 330 335 Leu Asn Lys Leu Asn Asn Leu Thr Ser Gly Thr Ser Val Leu Lys Lys 340 345 350 Arg Ala Leu Pro Lys Asp Trp Ser Ser Gln Gly Lys Asn Ala Leu Phe 355 360 365 Arg Glu Ile Asn Val Leu Asp Ile Cys Ser Lys Pro Glu Ser Val Ile 370 375 380 Leu Leu Asn Thr Ser Tyr Tyr Ser Phe Ser Leu Trp Glu Gly Asp Cys 385 390 395 400 Asn Phe Thr Lys Asp Met Ile Ser Gln Leu Val Pro Glu Cys Asp Gly 405 410 415 Phe Tyr Asn Asn Ser Lys Trp Met His Met His Pro Tyr Ala Cys Arg 420 425 430 Phe Trp Arg Ser Lys Lys Asn Glu Lys Glu Glu Thr Lys Cys Arg Asp 435 440 445 Gly Glu Thr Lys Arg Cys Leu Tyr Tyr Pro Leu Trp Asp Ser Pro Glu 450 455 460 Ser Thr Tyr Asp Phe Gly Tyr Leu Ala Tyr Gln Lys Asn Phe Pro Ser 465 470 475 480 Pro Ile Cys Ile Glu Gln Gln Lys Ile Arg Asp Gln Asp Tyr Glu Val 485 490 495 Tyr Ser Leu Tyr Gln Glu Arg Lys Ile Ala Ser Lys Ala Tyr Gly Ile 500 505 510 Asp Thr Val Leu Phe Ser Leu Lys Asn Phe Leu Asn Tyr Thr Gly Thr 515 520 525 Pro Val Asn Glu Met Pro Asn Ala Arg Ala Phe Val Gly Leu Ile Asp 530 535 540 Pro Lys Phe Pro Pro Ser Tyr Pro Asn Val Thr Arg Glu His Tyr Thr 545 550 555 560 Ser Cys Asn Asn Arg Lys Arg Arg Ser Val Asp Asn Asn Tyr Ala Lys 565 570 575 Leu Arg Ser Met Gly Tyr Ala Leu Thr Gly Ala Val Gln Thr Leu Ser 580 585 590 Gln Ile Ser Asp Ile Asn Asp Glu Asn Leu Gln Gln Gly Ile Tyr Leu 595 600 605 Leu Arg Asp His Val Ile Thr Leu Met Glu Ala Thr Leu His Asp Ile 610 615 620 Ser Val Met Glu Gly Met Phe Ala Val Gln His Leu His Thr His Leu 625 630 635 640 Asn His Leu Lys Thr Met Leu Leu Glu Arg Arg Ile Asp Trp Thr Tyr 645 650 655 Met Ser Ser Thr Trp Leu Gln Gln Gln Leu Gln Lys Ser Asp Asp Glu 660 665 670 Met Lys Val Ile Lys Arg Ile Ala Arg Ser Leu Val Tyr Tyr Val Lys 675 680 685 Gln Thr His Ser Ser Pro Thr Ala Thr Ala Trp Glu Ile Gly Leu Tyr 690 695 700 Tyr Glu Leu Val Ile Pro Lys His Ile Tyr Leu Asn Asn Trp Asn Val 705 710 715 720 Val Asn Ile Gly His Leu Val Lys Ser Ala Gly Gln Leu Thr His Val 725 730 735 Thr Ile Ala His Pro Tyr Glu Ile Ile Asn Lys Glu Cys Val Glu Thr 740 745 750 Ile Tyr Leu His Leu Glu Asp Cys Thr Arg Gln Asp Tyr Val Ile Cys 755 760 765 Asp Val Val Lys Ile Val Gln Pro Cys Gly Asn Ser Ser Asp Thr Ser 770 775 780 Asp Cys Pro Val Trp Ala Glu Ala Val Lys Glu Pro Phe Val Gln Val 785 790 795 800 Asn Pro Leu Lys Asn Gly Ser Tyr Leu Val Leu Ala Ser Ser Thr Asp 805 810 815 Cys Gln Ile Pro Pro Tyr Val Pro Ser Ile Val Thr Val Asn Glu Thr 820 825 830 Thr Ser Cys Phe Gly Leu Asp Phe Lys Arg Pro Leu Val Ala Glu Glu 835 840 845 Arg Leu Ser Phe Glu Pro Arg Leu Pro Asn Leu Gln Leu Arg Leu Pro 850 855 860 His Leu Val Gly Ile Ile Ala Lys Ile Lys Gly Ile Lys Ile Glu Val 865 870 875 880 Thr Ser Ser Gly Glu Ser Ile Lys Glu Gln Ile Glu Arg Ala Lys Ala 885 890 895 Glu Leu Leu Arg Leu Asp Ile His Glu Gly Asp Thr Pro Ala Trp Ile 900 905 910 Gln Gln Leu Ala Ala Ala Thr Lys Asp Val Trp Pro Ala Ala Ala Ser 915 920 925 Ala Leu Gln Gly Ile Gly Asn Phe Leu Ser Gly Thr Ala Gln Gly Ile 930 935 940 Phe Gly Thr Ala Phe Ser Leu Leu Gly Tyr Leu Lys Pro Ile Leu Ile 945 950 955 960 Gly Val Gly Val Ile Leu Leu Val Ile Leu Ile Phe Lys Ile Val Ser 965 970 975 Trp Ile Pro Thr Lys Lys Lys Asn Gln 980 985 <210> 459 <211> 2742 <212> DNA <213> Varicellovirus Pseudorabies virus <400> 459 atgcctgcag gtggcggatt gtggagagga ccaaggggac atagacctgg acatcatggt 60 ggggcaggtt tgggtaggct ctggccagca cctcatcatg ccgccgccgc tagaggggca 120 gttgcactgg ctcttttgct cctcgcactg gcagcagctc caccatgtgg agccgcagct 180 gttacacgcg ctgctagtgc atctcccacc ccgggcaccg gagcaacgcc aaatgatgtg 240 agcgctgaag ctagtcttga agaaatagaa gcttttagcc ctgggcctag cgaagctcct 300 gatggtgaat atggagatct tgatgcacgt acagcagtcc gagcagcggc cactgaacgc 360 gataggtttt atgtttgtcc cccaccaagc ggaagcactg ttgttagact tgaaccagaa 420 caagcatgtc ctgaatatag ccaaggcagg aattttaccg aaggtatagc agtcctgttt 480 aaagaaaata tcgctcccca taagtttaaa gctcacatat actacaagaa tgtgatagtg 540 acaacagtct ggagtggaag tacctatgca gctattacca atcggtttac ggatcgggta 600 cctgtgcctg tacaagaaat aacagatgta atagataggc gcgggaaatg tgtgagcaaa 660 gcagaatatg taagaaacaa tcataaagtt acagcttttg accgagatga aaatccggta 720 gaagtagatc tccgaccttc ccggctcaat gctctgggta cgcggggatg gcatacaaca 780 aatgatactt atacaaagat aggagcggca ggattttatc ataccgggac aagcgttaat 840 tgtattgtgg aagaagtaga agcacgatct gtctatccat atgattcatt tgcactctct 900 acaggcgata tagtctatat gagccctttc tatgggctcc gtgaaggagc tcatggcgaa 960 catatagggt atgcccctgg caggtttcaa caagtcgaac attattatcc aattgatctt 1020 gattcccggc tgcgggctag tgaatcagtt acaagaaatt tcctgcggac ccctcatttt 1080 accgtagcat gggattgggc acccaaaact cgtagagtct gtagtttggc gaaatggcgt 1140 gaagcggaag aaatgacacg ggatgaaacc cgagatggat catttcgatt tacctcacgt 1200 gctctcggag cttcatttgt atctgatgtt acccaactcg atctccaacg ggtccatctt 1260 ggggattgtg tactgagaga agcgagcgaa gcgattgatg ctatttatcg ccgccgatat 1320 aatagtaccc atgtccttgc gggagatcgt ccggaagttt atctggcgag aggtgggttt 1380 gttgtagcat ttcgacctct cattagcaat gaactcgccc aattgtatgc acgagaactg 1440 gaaagattgg gactggcggg agttgttgga ccagctgctc ctgctgcagc aagacgtgct 1500 agaaggtctc ctggtcctgc cggtaccccg gaaccacccg cagttaatgg gaccggtcat 1560 ttgaggataa caactgggag cgccgagttc gctcggctcc aatttactta tgatcatatt 1620 caagcacatg tcaatgatat gctcggtagg atagcagcgg catggtgtga actccaaaat 1680 aaagatcgaa cactctggtc tgaaatgtca cggctcaatc catccgctgt tgcaacagcg 1740 gcactgggtc aacgagtgtc agcaaggatg ctgggcgatg taatggctat ttctaggtgt 1800 gttgaagtcc ggggtggggt atatgttcaa aattctatgc gtgtcccagg tgaaagaggt 1860 acctgttatt cccgacccct tgtaactttt gaacataatg gaacaggtgt catagaagga 1920 caacttgggg atgataatga actgctgatt tcacgtgatc tgattgaacc ttgtactggt 1980 aatcatcgca ggtatttcaa actgggatct ggatatgtct attatgaaga ttataactat 2040 gtaaggatgg tcgaagttcc ggaaaccatt tccaccaggg tcacactcaa tctcacactc 2100 ctcgaagata gagaatttct tcctcttgaa gtctatacac gggaagaact ggctgatact 2160 gggctgcttg attattccga aattcaacga cgaaatcaac ttcacgccct gaaattttat 2220 gatattgata gggtagttaa agtcgatcac aatgttgtat tgctccgtgg aattgcaaat 2280 ttctttcaag gtcttgggga tgttggagca gctgtgggga aagtcgtgct cggcgctact 2340 ggcgcggtta tttctgcggt gggcgggatg gttagctttc tctctaatcc ttttggagct 2400 ctggcaattg gtcttttggt cttggcgggg cttgttgctg catttcttgc atataggcat 2460 attagcagac ttagaaggaa tccaatgaaa gcactctatc ctgtgactac caaaacactg 2520 aaagaagatg gtgtggatga gggagatgtc gatgaagcaa aacttgatca agctagagat 2580 atgattcgct atatgtctat tgtctcagca cttgaacaac aagaacataa agcaaggaag 2640 aagaatagtg gcccagcact ccttgcgtca agagtgggcg ccatggcaac aaggagacga 2700 cattatcaaa ggctggaaag tgaagatcca gatgcgttgt aa 2742 <210> 460 <211> 913 <212> PRT <213> Varicellovirus Pseudorabies virus <400> 460 Met Pro Ala Gly Gly Gly Leu Trp Arg Gly Pro Arg Gly His Arg Pro 1 5 10 15 Gly His His Gly Gly Ala Gly Leu Gly Arg Leu Trp Pro Ala Pro His 20 25 30 His Ala Ala Ala Ala Arg Gly Ala Val Ala Leu Ala Leu Leu Leu Leu 35 40 45 Ala Leu Ala Ala Ala Pro Pro Cys Gly Ala Ala Ala Val Thr Arg Ala 50 55 60 Ala Ser Ala Ser Pro Thr Pro Gly Thr Gly Ala Thr Pro Asn Asp Val 65 70 75 80 Ser Ala Glu Ala Ser Leu Glu Glu Ile Glu Ala Phe Ser Pro Gly Pro 85 90 95 Ser Glu Ala Pro Asp Gly Glu Tyr Gly Asp Leu Asp Ala Arg Thr Ala 100 105 110 Val Arg Ala Ala Ala Thr Glu Arg Asp Arg Phe Tyr Val Cys Pro Pro 115 120 125 Pro Ser Gly Ser Thr Val Val Arg Leu Glu Pro Glu Gln Ala Cys Pro 130 135 140 Glu Tyr Ser Gln Gly Arg Asn Phe Thr Glu Gly Ile Ala Val Leu Phe 145 150 155 160 Lys Glu Asn Ile Ala Pro His Lys Phe Lys Ala His Ile Tyr Tyr Lys 165 170 175 Asn Val Ile Val Thr Thr Val Trp Ser Gly Ser Thr Tyr Ala Ala Ile 180 185 190 Thr Asn Arg Phe Thr Asp Arg Val Pro Val Pro Val Gln Glu Ile Thr 195 200 205 Asp Val Ile Asp Arg Arg Gly Lys Cys Val Ser Lys Ala Glu Tyr Val 210 215 220 Arg Asn Asn His Lys Val Thr Ala Phe Asp Arg Asp Glu Asn Pro Val 225 230 235 240 Glu Val Asp Leu Arg Pro Ser Arg Leu Asn Ala Leu Gly Thr Arg Gly 245 250 255 Trp His Thr Thr Asn Asp Thr Tyr Thr Lys Ile Gly Ala Ala Gly Phe 260 265 270 Tyr His Thr Gly Thr Ser Val Asn Cys Ile Val Glu Glu Val Glu Ala 275 280 285 Arg Ser Val Tyr Pro Tyr Asp Ser Phe Ala Leu Ser Thr Gly Asp Ile 290 295 300 Val Tyr Met Ser Pro Phe Tyr Gly Leu Arg Glu Gly Ala His Gly Glu 305 310 315 320 His Ile Gly Tyr Ala Pro Gly Arg Phe Gln Gln Val Glu His Tyr Tyr 325 330 335 Pro Ile Asp Leu Asp Ser Arg Leu Arg Ala Ser Glu Ser Val Thr Arg 340 345 350 Asn Phe Leu Arg Thr Pro His Phe Thr Val Ala Trp Asp Trp Ala Pro 355 360 365 Lys Thr Arg Arg Val Cys Ser Leu Ala Lys Trp Arg Glu Ala Glu Glu 370 375 380 Met Thr Arg Asp Glu Thr Arg Asp Gly Ser Phe Arg Phe Thr Ser Arg 385 390 395 400 Ala Leu Gly Ala Ser Phe Val Ser Asp Val Thr Gln Leu Asp Leu Gln 405 410 415 Arg Val His Leu Gly Asp Cys Val Leu Arg Glu Ala Ser Glu Ala Ile 420 425 430 Asp Ala Ile Tyr Arg Arg Arg Tyr Asn Ser Thr His Val Leu Ala Gly 435 440 445 Asp Arg Pro Glu Val Tyr Leu Ala Arg Gly Gly Phe Val Val Ala Phe 450 455 460 Arg Pro Leu Ile Ser Asn Glu Leu Ala Gln Leu Tyr Ala Arg Glu Leu 465 470 475 480 Glu Arg Leu Gly Leu Ala Gly Val Val Gly Pro Ala Ala Pro Ala Ala 485 490 495 Ala Arg Arg Ala Arg Arg Ser Pro Gly Pro Ala Gly Thr Pro Glu Pro 500 505 510 Pro Ala Val Asn Gly Thr Gly His Leu Arg Ile Thr Thr Gly Ser Ala 515 520 525 Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asp His Ile Gln Ala His Val 530 535 540 Asn Asp Met Leu Gly Arg Ile Ala Ala Ala Trp Cys Glu Leu Gln Asn 545 550 555 560 Lys Asp Arg Thr Leu Trp Ser Glu Met Ser Arg Leu Asn Pro Ser Ala 565 570 575 Val Ala Thr Ala Ala Leu Gly Gln Arg Val Ser Ala Arg Met Leu Gly 580 585 590 Asp Val Met Ala Ile Ser Arg Cys Val Glu Val Arg Gly Gly Val Tyr 595 600 605 Val Gln Asn Ser Met Arg Val Pro Gly Glu Arg Gly Thr Cys Tyr Ser 610 615 620 Arg Pro Leu Val Thr Phe Glu His Asn Gly Thr Gly Val Ile Glu Gly 625 630 635 640 Gln Leu Gly Asp Asp Asn Glu Leu Leu Ile Ser Arg Asp Leu Ile Glu 645 650 655 Pro Cys Thr Gly Asn His Arg Arg Tyr Phe Lys Leu Gly Ser Gly Tyr 660 665 670 Val Tyr Tyr Glu Asp Tyr Asn Tyr Val Arg Met Val Glu Val Pro Glu 675 680 685 Thr Ile Ser Thr Arg Val Thr Leu Asn Leu Thr Leu Leu Glu Asp Arg 690 695 700 Glu Phe Leu Pro Leu Glu Val Tyr Thr Arg Glu Glu Leu Ala Asp Thr 705 710 715 720 Gly Leu Leu Asp Tyr Ser Glu Ile Gln Arg Arg Asn Gln Leu His Ala 725 730 735 Leu Lys Phe Tyr Asp Ile Asp Arg Val Val Lys Val Asp His Asn Val 740 745 750 Val Leu Leu Arg Gly Ile Ala Asn Phe Phe Gln Gly Leu Gly Asp Val 755 760 765 Gly Ala Ala Val Gly Lys Val Val Leu Gly Ala Thr Gly Ala Val Ile 770 775 780 Ser Ala Val Gly Gly Met Val Ser Phe Leu Ser Asn Pro Phe Gly Ala 785 790 795 800 Leu Ala Ile Gly Leu Leu Val Leu Ala Gly Leu Val Ala Ala Phe Leu 805 810 815 Ala Tyr Arg His Ile Ser Arg Leu Arg Arg Asn Pro Met Lys Ala Leu 820 825 830 Tyr Pro Val Thr Thr Lys Thr Leu Lys Glu Asp Gly Val Asp Glu Gly 835 840 845 Asp Val Asp Glu Ala Lys Leu Asp Gln Ala Arg Asp Met Ile Arg Tyr 850 855 860 Met Ser Ile Val Ser Ala Leu Glu Gln Gln Glu His Lys Ala Arg Lys 865 870 875 880 Lys Asn Ser Gly Pro Ala Leu Leu Ala Ser Arg Val Gly Ala Met Ala 885 890 895 Thr Arg Arg Arg His Tyr Gln Arg Leu Glu Ser Glu Asp Pro Asp Ala 900 905 910 Leu <210> 461 <211> 1203 <212> DNA <213> Varicellovirus Pseudorabies virus <400> 461 atgttgcttg ctgctctcct ggctgctctc gtcgcacgca caacgcttgg ggccgatgta 60 gatgctgttc ctgctcctac atttccaccc ccagcctatc catatacaga atcctggcaa 120 cttacattga ctaccgttcc aagtccgttt gtggggcctg ccgatgtgta tcatacacgg 180 ccattggaag atccatgtgg tgtcgtagcc ttgatttctg atccccaagt cgatcgactt 240 cttaatgaag cagtcgctca tcgtagacct acctatagag ctcatgtcgc ttggtatagg 300 atagcagatg gctgtgccca tctcctctat ttcattgaat atgcagattg tgatccacgg 360 caaatattcg gccggtgtcg caggcggaca acacctatgt ggtggacacc aagtgcagat 420 tatatgtttc ctaccgaaga tgaattgggt ttgctgatgg tagcgcccgg caggtttaat 480 gaagggcaat atcgcagact cgtctcagtg gatggagtaa atattcttac agattttatg 540 gtcgctctgc cagaaggaca ggaatgtcct tttgcgagag tcgatcaaca tcggacatat 600 aaatttggtg cttgttggaa tgatgaatct tttcgcagag gagttgatgt tatgcgtttt 660 ctcactccat tttatcaaca accaccccat cgtgaagtcg taaattattg gtataggaag 720 aatggacgca ccctgccaag ggcgtatgct gcggcaacac cttatgcaat agatccagcc 780 agaccttcag ccggatcacc tcgcccaaga ccaagaccta ggcctcgtcc caaaccggaa 840 ccagcgcccg ttacacctgc tccacctggg aggctccctg aacccgcaac aagagatcat 900 gcagctggcg ggcatccaac acctaggcca ccccgaccag aaacacccca taggccattt 960 gcgccaccag cggtggttcc atctggatgg ccccaacctg ccgaaccttt tcaaccacgc 1020 actccagcag cccccggagt gtctcgtcat cggagcgtca ttgtgggaac tggtactgct 1080 atgggtgccc tgttggtagg agtttgtgtg tatatattct ttcggcttcg aggcgctaaa 1140 ggctacaggc tgttgggtgg cccagctgat acggatgaac tcaaggccca accagggcca 1200 taa 1203 <210> 462 <211> 400 <212> PRT <213> Varicellovirus Pseudorabies virus <400> 462 Met Leu Leu Ala Ala Leu Leu Ala Ala Leu Val Ala Arg Thr Thr Leu 1 5 10 15 Gly Ala Asp Val Asp Ala Val Pro Ala Pro Thr Phe Pro Pro Pro Ala 20 25 30 Tyr Pro Tyr Thr Glu Ser Trp Gln Leu Thr Leu Thr Thr Val Pro Ser 35 40 45 Pro Phe Val Gly Pro Ala Asp Val Tyr His Thr Arg Pro Leu Glu Asp 50 55 60 Pro Cys Gly Val Val Ala Leu Ile Ser Asp Pro Gln Val Asp Arg Leu 65 70 75 80 Leu Asn Glu Ala Val Ala His Arg Arg Pro Thr Tyr Arg Ala His Val 85 90 95 Ala Trp Tyr Arg Ile Ala Asp Gly Cys Ala His Leu Leu Tyr Phe Ile 100 105 110 Glu Tyr Ala Asp Cys Asp Pro Arg Gln Ile Phe Gly Arg Cys Arg Arg 115 120 125 Arg Thr Thr Pro Met Trp Trp Thr Pro Ser Ala Asp Tyr Met Phe Pro 130 135 140 Thr Glu Asp Glu Leu Gly Leu Leu Met Val Ala Pro Gly Arg Phe Asn 145 150 155 160 Glu Gly Gln Tyr Arg Arg Leu Val Ser Val Asp Gly Val Asn Ile Leu 165 170 175 Thr Asp Phe Met Val Ala Leu Pro Glu Gly Gln Glu Cys Pro Phe Ala 180 185 190 Arg Val Asp Gln His Arg Thr Tyr Lys Phe Gly Ala Cys Trp Asn Asp 195 200 205 Glu Ser Phe Arg Arg Gly Val Asp Val Met Arg Phe Leu Thr Pro Phe 210 215 220 Tyr Gln Gln Pro Pro His Arg Glu Val Val Asn Tyr Trp Tyr Arg Lys 225 230 235 240 Asn Gly Arg Thr Leu Pro Arg Ala Tyr Ala Ala Ala Thr Pro Tyr Ala 245 250 255 Ile Asp Pro Ala Arg Pro Ser Ala Gly Ser Pro Arg Pro Arg Pro Arg 260 265 270 Pro Arg Pro Arg Pro Lys Pro Glu Pro Ala Pro Val Thr Pro Ala Pro 275 280 285 Pro Gly Arg Leu Pro Glu Pro Ala Thr Arg Asp His Ala Ala Gly Gly 290 295 300 His Pro Thr Pro Arg Pro Pro Arg Pro Glu Thr Pro His Arg Pro Phe 305 310 315 320 Ala Pro Pro Ala Val Val Pro Ser Gly Trp Pro Gln Pro Ala Glu Pro 325 330 335 Phe Gln Pro Arg Thr Pro Ala Ala Pro Gly Val Ser Arg His Arg Ser 340 345 350 Val Ile Val Gly Thr Gly Thr Ala Met Gly Ala Leu Leu Val Gly Val 355 360 365 Cys Val Tyr Ile Phe Phe Arg Leu Arg Gly Ala Lys Gly Tyr Arg Leu 370 375 380 Leu Gly Gly Pro Ala Asp Thr Asp Glu Leu Lys Ala Gln Pro Gly Pro 385 390 395 400 <210> 463 <211> 2061 <212> DNA <213> Varicellovirus Pseudorabies virus <400> 463 atgcccgcca gttcagtccg gctccctctg cggttgctta ctcttgccgg tcttttggct 60 cttgctggcg cagcagctct ggctcgagga gctccacaag gcggtccacc atcaccccaa 120 ggcgggcctg ctccgacagc tgctccagca agaggaccta cactctttgt gcttgtaggt 180 gatggatcag catggtttgt gtttcaactg ggtggcttgg gagccctgaa tgatacaaga 240 ataaggggac atctcctggg aaggtatctg gtttcatatc aagtagtacc cccacctgtg 300 tcagcttggt atttcgtaca acgtcccaga gaacggccta ggcttagcgg accaccttca 360 ggagctgaac tggtagcttt tgatgcccct ggggtgagaa ggacatatac aaccgctgcc 420 gtttggcctg ccgaagttgc tgttctggca gatgctgaag ccaggtgtcc agctgcagtt 480 ttcaatgtta ccctcgggga agcgtttctg ggtttgaggg tggcattgcg gagcttcttg 540 ccactcgaag tgattattag cgctgaaagg atgcggatga ttgcaccgcc cgcccttggt 600 tccgatctcg aacccccagg gccacctgcc gggcggtttc atgtctatac actgggattt 660 ctgagcgatg gcgctatgca tcaaacaatg agagatgtcg cggcatatgt ccatgaatcc 720 gatgattatc tggctcaact ttcagctgct catgccgcgg ctcttgctgc agtcgtccaa 780 cctggtccat attatttcta tcgggccgcc gtccgactgg gagtagcggc atttgtgttt 840 tcagaagccg ctcgaaggga tagacgggcg agcgcccctg ccctgctccg agtagaatcc 900 gatgctagac tcctttcaag actcctgatg agggccgctg ggtgtcctgc agggtttgca 960 ggtctgtttg atggacgtgc tgaacgagtg cctgtcgctc ctgccgatca actgcgggca 1020 gcatggacat ttggggaaga tcctgcaccg cgtcttgatc tggcaagagc aacggtggca 1080 gaagcctata ggagatctgt tcgaggaaaa ccgtttgatc aacaagccct gttcttcgca 1140 gtggcattgc tcctcagggc aggtgggcct ggggatgcca gagaaactct cctcagaaca 1200 accgcaatgt gtactgctga acgggcagcg gcagcggcgg aactgacaag agcggccctg 1260 agccccaccg cggcctggaa tgaaccattt tccttgttgg atgtgcttag cccatgtgct 1320 gtgtctctca gaagggatct tggcggagat gctacattgg caaatctcgg ggctgcagcc 1380 agattggccc tcgcaccagc gggcgcacct ggggcagctg ccgccactga tgaaggagca 1440 gaagaagaag aagaagatcc ggtggcaaga gcggccccgg aaattccagc tgaagctctc 1500 ttggcgctcc ctctccgagg cggggcatct tttgtcttta caagacgccg acccgattgt 1560 ggacccgcct atacccttgg tggagttgat attgctaatc ctctggtcct tgcaattgtt 1620 tcaaatgatt ccgcagcctg tgattatacc gacagaatgc ctgaaagcca acatcttcct 1680 gccaccgata atcccagcgt ctgtgtttat tgtgattgtg tctttgtcag gtattcaagt 1740 gctgggacca ttctcgaaac tgtgctgata gaaagtaaag atatggaaga acaattgatg 1800 gctggggcta attctactat tccatcattt aatccaacac ttcatggtgg ggatgtgaaa 1860 gctcttatgc tgtttcctaa tggaacagtt gttgatcttt tgagctttac ctctaccaga 1920 ctggcacctg tcagccccgc ttatgttgtt gcatcagttg taggtgccgc tattactgtc 1980 ggcattcttt atgcactttt caaaatgctt tgttcattta gcagtgaagg gtacagcaga 2040 cttattaatg cacgcagcta g 2061 <210> 464 <211> 686 <212> PRT <213> Varicellovirus Pseudorabies virus <400> 464 Met Pro Ala Ser Ser Val Arg Leu Pro Leu Arg Leu Leu Thr Leu Ala 1 5 10 15 Gly Leu Leu Ala Leu Ala Gly Ala Ala Ala Leu Ala Arg Gly Ala Pro 20 25 30 Gln Gly Gly Pro Pro Ser Pro Gln Gly Gly Pro Ala Pro Thr Ala Ala 35 40 45 Pro Ala Arg Gly Pro Thr Leu Phe Val Leu Val Gly Asp Gly Ser Ala 50 55 60 Trp Phe Val Phe Gln Leu Gly Gly Leu Gly Ala Leu Asn Asp Thr Arg 65 70 75 80 Ile Arg Gly His Leu Leu Gly Arg Tyr Leu Val Ser Tyr Gln Val Val 85 90 95 Pro Pro Pro Val Ser Ala Trp Tyr Phe Val Gln Arg Pro Arg Glu Arg 100 105 110 Pro Arg Leu Ser Gly Pro Pro Ser Gly Ala Glu Leu Val Ala Phe Asp 115 120 125 Ala Pro Gly Val Arg Arg Thr Tyr Thr Thr Ala Ala Val Trp Pro Ala 130 135 140 Glu Val Ala Val Leu Ala Asp Ala Glu Ala Arg Cys Pro Ala Ala Val 145 150 155 160 Phe Asn Val Thr Leu Gly Glu Ala Phe Leu Gly Leu Arg Val Ala Leu 165 170 175 Arg Ser Phe Leu Pro Leu Glu Val Ile Ile Ser Ala Glu Arg Met Arg 180 185 190 Met Ile Ala Pro Pro Ala Leu Gly Ser Asp Leu Glu Pro Pro Gly Pro 195 200 205 Pro Ala Gly Arg Phe His Val Tyr Thr Leu Gly Phe Leu Ser Asp Gly 210 215 220 Ala Met His Gln Thr Met Arg Asp Val Ala Ala Tyr Val His Glu Ser 225 230 235 240 Asp Asp Tyr Leu Ala Gln Leu Ser Ala Ala His Ala Ala Ala Leu Ala 245 250 255 Ala Val Val Gln Pro Gly Pro Tyr Tyr Phe Tyr Arg Ala Ala Val Arg 260 265 270 Leu Gly Val Ala Ala Phe Val Phe Ser Glu Ala Ala Arg Arg Asp Arg 275 280 285 Arg Ala Ser Ala Pro Ala Leu Leu Arg Val Glu Ser Asp Ala Arg Leu 290 295 300 Leu Ser Arg Leu Leu Met Arg Ala Ala Gly Cys Pro Ala Gly Phe Ala 305 310 315 320 Gly Leu Phe Asp Gly Arg Ala Glu Arg Val Pro Val Ala Pro Ala Asp 325 330 335 Gln Leu Arg Ala Ala Trp Thr Phe Gly Glu Asp Pro Ala Pro Arg Leu 340 345 350 Asp Leu Ala Arg Ala Thr Val Ala Glu Ala Tyr Arg Arg Ser Val Arg 355 360 365 Gly Lys Pro Phe Asp Gln Gln Ala Leu Phe Phe Ala Val Ala Leu Leu 370 375 380 Leu Arg Ala Gly Gly Pro Gly Asp Ala Arg Glu Thr Leu Leu Arg Thr 385 390 395 400 Thr Ala Met Cys Thr Ala Glu Arg Ala Ala Ala Ala Ala Glu Leu Thr 405 410 415 Arg Ala Ala Leu Ser Pro Thr Ala Ala Trp Asn Glu Pro Phe Ser Leu 420 425 430 Leu Asp Val Leu Ser Pro Cys Ala Val Ser Leu Arg Arg Asp Leu Gly 435 440 445 Gly Asp Ala Thr Leu Ala Asn Leu Gly Ala Ala Ala Arg Leu Ala Leu 450 455 460 Ala Pro Ala Gly Ala Pro Gly Ala Ala Ala Ala Thr Asp Glu Gly Ala 465 470 475 480 Glu Glu Glu Glu Glu Asp Pro Val Ala Arg Ala Ala Pro Glu Ile Pro 485 490 495 Ala Glu Ala Leu Leu Ala Leu Pro Leu Arg Gly Gly Ala Ser Phe Val 500 505 510 Phe Thr Arg Arg Arg Pro Asp Cys Gly Pro Ala Tyr Thr Leu Gly Gly 515 520 525 Val Asp Ile Ala Asn Pro Leu Val Leu Ala Ile Val Ser Asn Asp Ser 530 535 540 Ala Ala Cys Asp Tyr Thr Asp Arg Met Pro Glu Ser Gln His Leu Pro 545 550 555 560 Ala Thr Asp Asn Pro Ser Val Cys Val Tyr Cys Asp Cys Val Phe Val 565 570 575 Arg Tyr Ser Ser Ala Gly Thr Ile Leu Glu Thr Val Leu Ile Glu Ser 580 585 590 Lys Asp Met Glu Glu Gln Leu Met Ala Gly Ala Asn Ser Thr Ile Pro 595 600 605 Ser Phe Asn Pro Thr Leu His Gly Gly Asp Val Lys Ala Leu Met Leu 610 615 620 Phe Pro Asn Gly Thr Val Val Asp Leu Leu Ser Phe Thr Ser Thr Arg 625 630 635 640 Leu Ala Pro Val Ser Pro Ala Tyr Val Val Ala Ser Val Val Gly Ala 645 650 655 Ala Ile Thr Val Gly Ile Leu Tyr Ala Leu Phe Lys Met Leu Cys Ser 660 665 670 Phe Ser Ser Glu Gly Tyr Ser Arg Leu Ile Asn Ala Arg Ser 675 680 685 <210> 465 <211> 471 <212> DNA <213> Varicellovirus Pseudorabies virus <400> 465 atgagcccac tggtagccgt acttgttttc ttctctgccg ctcttggcat acccggtcct 60 ggagtggccg gtaatccaag gggccttgac gcgatatttg aagctcccgt gactccggcc 120 ccaccaaccc gacacccaag aagagaagaa ctcgaatggg atgacgaaga ccatcccctg 180 cttgatctgg aacccccagt cggttctaga tgtcaccctt atattgccta tagtttgccc 240 ccagatatga atgcggtgac ctctgtcgtg gtcaaaccgt attgtagccc acccgaagtg 300 atattgtggg cctcaggaac tgcatatctc gttaatccgt tcgttgcgat tcaagctttg 360 gctgtgggag aaccactgaa cgaagctgcg ttgaaagaac ttggcgaagt cgcagtccat 420 aaagattcat tgccaccctt gcgttacaac ggtggaccac cggctgaatg a 471 <210> 466 <211> 156 <212> PRT <213> Varicellovirus Pseudorabies virus <400> 466 Met Ser Pro Leu Val Ala Val Leu Val Phe Phe Ser Ala Ala Leu Gly 1 5 10 15 Ile Pro Gly Pro Gly Val Ala Gly Asn Pro Arg Gly Leu Asp Ala Ile 20 25 30 Phe Glu Ala Pro Val Thr Pro Ala Pro Pro Thr Arg His Pro Arg Arg 35 40 45 Glu Glu Leu Glu Trp Asp Asp Glu Asp His Pro Leu Leu Asp Leu Glu 50 55 60 Pro Pro Val Gly Ser Arg Cys His Pro Tyr Ile Ala Tyr Ser Leu Pro 65 70 75 80 Pro Asp Met Asn Ala Val Thr Ser Val Val Val Lys Pro Tyr Cys Ser 85 90 95 Pro Pro Glu Val Ile Leu Trp Ala Ser Gly Thr Ala Tyr Leu Val Asn 100 105 110 Pro Phe Val Ala Ile Gln Ala Leu Ala Val Gly Glu Pro Leu Asn Glu 115 120 125 Ala Ala Leu Lys Glu Leu Gly Glu Val Ala Val His Lys Asp Ser Leu 130 135 140 Pro Pro Leu Arg Tyr Asn Gly Gly Pro Pro Ala Glu 145 150 155 <210> 467 <211> 2715 <212> DNA <213> Simplexvirus Herpes simplex virus 1 <400> 467 atgaggcaag gtgcacctgc caggggtcgg agatggtttg ttgtatgggc tctgctggga 60 ctgactttgg gcgtgctcgt tgcttccgca gcaccctctt ctccaggaac acctggcgtg 120 gctgcagcca cgcaagctgc taatggcggg ccagctaccc cagccccacc ggcaccagga 180 gctccaccta ctggcgatcc caagccaaag aagaataaga agccaaagcc acctaaaccc 240 cctcgaccag ctggtgataa tgctacagtg gctgcaggtc atgctacact cagagaacat 300 cttagagata taaaagctga aaatacagac gctaatttct atgtctgtcc cccacctaca 360 ggtgcaaccg ttgtccaatt tgaacaaccc aggagatgtc ctacacgtcc agaagggcag 420 aattataccg aaggtatagc cgttgtgttt aaagaaaata ttgcaccata taaatttaaa 480 gcgacgatgt attataagga tgtgacagtc agccaagtat ggtttgggca tcgatatagc 540 caattcatgg gcattttcga agatagagca cctgtaccgt ttgaagaagt tatagataaa 600 ataaatgcaa aaggcgtgtg ccgtagcaca gcgaaatatg ttcggaataa tttggaaaca 660 acggcattcc atcgcgatga tcatgaaaca gatatggaac ttaagcccgc aaatgctgcc 720 acacgtacct ctcgtgggtg gcatactaca gatctgaaat ataatccatc acgagtcgaa 780 gcatttcatc gatatggaac aaccgtgaat tgtattgtgg aagaagttga tgccagaagt 840 gtttatcctt atgatgaatt cgtcctcgca acaggagatt tcgtttatat gtcaccattc 900 tatggatatc gtgaaggtag tcatacagag catacttctt atgcagcaga taggtttaaa 960 caagtggatg gtttctatgc tcgggatttg actacaaaag caagagctac agcccccaca 1020 actcgaaatc ttctgaccac tcctaaattt actgtagcgt gggattgggt acccaaacga 1080 ccatccgtat gtactatgac aaaatggcaa gaagtagatg aaatgcttcg gtctgaatat 1140 ggtggaagct ttagattttc aagtgatgca atctctacta catttacaac taatctcaca 1200 gaatatcccc tttcacgagt cgatttggga gattgtattg gtaaagatgc gcgggatgca 1260 atggatcgga tatttgctcg tagatataat gccacacata taaaagttgg acaaccacaa 1320 tattatctcg caaacggcgg gttcctcatt gcctatcaac cgctcctttc taatactctt 1380 gccgaactct atgtccgaga gcatctgagg gaacaatcac gtaaaccgcc gaatccaaca 1440 cctcctccgc ctggagcatc cgcgaatgcc tctgtcgaac gtataaagac aacgtcttca 1500 attgaatttg ctagacttca attcacctat aatcatatcc aaaggcacgt taatgacatg 1560 ctgggtagag tcgcaattgc ttggtgtgaa ttgcaaaacc atgaacttac gttgtggaat 1620 gaagcacgta aattgaatcc aaatgcaatt gctagcgcga cggttggacg cagagtttcc 1680 gcccgaatgc tgggagatgt tatggcagtt tctacatgtg tccccgtggc tgccgataat 1740 gtcatagtgc agaattcaat gagaatatct agccgacctg gtgcatgtta ttctagacca 1800 ctcgtgagtt tccgctatga ggatcaaggg cccctggttg aaggccaact cggagaaaat 1860 aatgaattgc gcttgacaag ggacgcaatt gaaccatgta cagttggcca tcgccggtat 1920 tttacatttg gcggcgggta tgtctacttt gaggaatatg cctatagtca tcaactttct 1980 cgtgctgata ttacaactgt gtcaacattt attgatctga atattacgat gcttgaagac 2040 cacgaattcg taccgttgga agtctataca cgccatgaga taaaagattc cgggcttttg 2100 gattataccg aagtgcaacg acggaatcaa ctccatgatc tccgattcgc ggatattgat 2160 accgtaattc atgctgatgc aaatgctgct atgtttgctg gacttggggc attctttgaa 2220 ggaatgggcg atctcggaag agcagttggg aaagtcgtta tgggaatagt tggtggtgtc 2280 gttagtgcgg tttcaggtgt cagcagcttt atgagcaatc cattcggcgc cctcgcagtt 2340 gggctcctgg tgcttgctgg gcttgctgct gctttctttg ctttccggta tgtgatgagg 2400 cttcaatcca atccaatgaa agcactttat cccttgacta ctaaagaact gaagaatccg 2460 actaatcctg atgcttcagg agaaggggaa gaaggcgggg atttcgatga agctaaactg 2520 gcggaagcac gtgaaatgat ccgttatatg gcattggtca gcgctatgga aagaaccgag 2580 cataaagcta agaagaaagg aacttctgcc cttctctctg ctaaagttac tgatatggtg 2640 atgagaaaac ggcgtaatac aaattatact caggtaccga ataaggatgg cgatgcagat 2700 gaagatgatt tgtaa 2715 <210> 468 <211> 904 <212> PRT <213> Simplexvirus Herpes simplex virus 1 <400> 468 Met Arg Gln Gly Ala Pro Ala Arg Gly Arg Arg Trp Phe Val Val Trp 1 5 10 15 Ala Leu Leu Gly Leu Thr Leu Gly Val Leu Val Ala Ser Ala Ala Pro 20 25 30 Ser Ser Pro Gly Thr Pro Gly Val Ala Ala Ala Thr Gln Ala Ala Asn 35 40 45 Gly Gly Pro Ala Thr Pro Ala Pro Pro Ala Pro Gly Ala Pro Pro Thr 50 55 60 Gly Asp Pro Lys Pro Lys Lys Asn Lys Lys Pro Lys Pro Pro Lys Pro 65 70 75 80 Pro Arg Pro Ala Gly Asp Asn Ala Thr Val Ala Ala Gly His Ala Thr 85 90 95 Leu Arg Glu His Leu Arg Asp Ile Lys Ala Glu Asn Thr Asp Ala Asn 100 105 110 Phe Tyr Val Cys Pro Pro Pro Thr Gly Ala Thr Val Val Gln Phe Glu 115 120 125 Gln Pro Arg Arg Cys Pro Thr Arg Pro Glu Gly Gln Asn Tyr Thr Glu 130 135 140 Gly Ile Ala Val Val Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys 145 150 155 160 Ala Thr Met Tyr Tyr Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly 165 170 175 His Arg Tyr Ser Gln Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val 180 185 190 Pro Phe Glu Glu Val Ile Asp Lys Ile Asn Ala Lys Gly Val Cys Arg 195 200 205 Ser Thr Ala Lys Tyr Val Arg Asn Asn Leu Glu Thr Thr Ala Phe His 210 215 220 Arg Asp Asp His Glu Thr Asp Met Glu Leu Lys Pro Ala Asn Ala Ala 225 230 235 240 Thr Arg Thr Ser Arg Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro 245 250 255 Ser Arg Val Glu Ala Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile 260 265 270 Val Glu Glu Val Asp Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val 275 280 285 Leu Ala Thr Gly Asp Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg 290 295 300 Glu Gly Ser His Thr Glu His Thr Ser Tyr Ala Ala Asp Arg Phe Lys 305 310 315 320 Gln Val Asp Gly Phe Tyr Ala Arg Asp Leu Thr Thr Lys Ala Arg Ala 325 330 335 Thr Ala Pro Thr Thr Arg Asn Leu Leu Thr Thr Pro Lys Phe Thr Val 340 345 350 Ala Trp Asp Trp Val Pro Lys Arg Pro Ser Val Cys Thr Met Thr Lys 355 360 365 Trp Gln Glu Val Asp Glu Met Leu Arg Ser Glu Tyr Gly Gly Ser Phe 370 375 380 Arg Phe Ser Ser Asp Ala Ile Ser Thr Thr Phe Thr Thr Asn Leu Thr 385 390 395 400 Glu Tyr Pro Leu Ser Arg Val Asp Leu Gly Asp Cys Ile Gly Lys Asp 405 410 415 Ala Arg Asp Ala Met Asp Arg Ile Phe Ala Arg Arg Tyr Asn Ala Thr 420 425 430 His Ile Lys Val Gly Gln Pro Gln Tyr Tyr Leu Ala Asn Gly Gly Phe 435 440 445 Leu Ile Ala Tyr Gln Pro Leu Leu Ser Asn Thr Leu Ala Glu Leu Tyr 450 455 460 Val Arg Glu His Leu Arg Glu Gln Ser Arg Lys Pro Pro Asn Pro Thr 465 470 475 480 Pro Pro Pro Pro Gly Ala Ser Ala Asn Ala Ser Val Glu Arg Ile Lys 485 490 495 Thr Thr Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asn His 500 505 510 Ile Gln Arg His Val Asn Asp Met Leu Gly Arg Val Ala Ile Ala Trp 515 520 525 Cys Glu Leu Gln Asn His Glu Leu Thr Leu Trp Asn Glu Ala Arg Lys 530 535 540 Leu Asn Pro Asn Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val Ser 545 550 555 560 Ala Arg Met Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro Val 565 570 575 Ala Ala Asp Asn Val Ile Val Gln Asn Ser Met Arg Ile Ser Ser Arg 580 585 590 Pro Gly Ala Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu Asp 595 600 605 Gln Gly Pro Leu Val Glu Gly Gln Leu Gly Glu Asn Asn Glu Leu Arg 610 615 620 Leu Thr Arg Asp Ala Ile Glu Pro Cys Thr Val Gly His Arg Arg Tyr 625 630 635 640 Phe Thr Phe Gly Gly Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr Ser 645 650 655 His Gln Leu Ser Arg Ala Asp Ile Thr Thr Val Ser Thr Phe Ile Asp 660 665 670 Leu Asn Ile Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu Val 675 680 685 Tyr Thr Arg His Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr Glu 690 695 700 Val Gln Arg Arg Asn Gln Leu His Asp Leu Arg Phe Ala Asp Ile Asp 705 710 715 720 Thr Val Ile His Ala Asp Ala Asn Ala Ala Met Phe Ala Gly Leu Gly 725 730 735 Ala Phe Phe Glu Gly Met Gly Asp Leu Gly Arg Ala Val Gly Lys Val 740 745 750 Val Met Gly Ile Val Gly Gly Val Val Ser Ala Val Ser Gly Val Ser 755 760 765 Ser Phe Met Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val 770 775 780 Leu Ala Gly Leu Ala Ala Ala Phe Phe Ala Phe Arg Tyr Val Met Arg 785 790 795 800 Leu Gln Ser Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Glu 805 810 815 Leu Lys Asn Pro Thr Asn Pro Asp Ala Ser Gly Glu Gly Glu Glu Gly 820 825 830 Gly Asp Phe Asp Glu Ala Lys Leu Ala Glu Ala Arg Glu Met Ile Arg 835 840 845 Tyr Met Ala Leu Val Ser Ala Met Glu Arg Thr Glu His Lys Ala Lys 850 855 860 Lys Lys Gly Thr Ser Ala Leu Leu Ser Ala Lys Val Thr Asp Met Val 865 870 875 880 Met Arg Lys Arg Arg Asn Thr Asn Tyr Thr Gln Val Pro Asn Lys Asp 885 890 895 Gly Asp Ala Asp Glu Asp Asp Leu 900 <210> 469 <211> 1185 <212> DNA <213> Simplexvirus Herpes simplex virus 1 <400> 469 atgggggggg ctgccgccag gttgggggcc gtgattttgt ttgtcgtcat agtgggcctc 60 catggggtcc gcagcaaata tgccttggtg gatgcctctc tcaagatggc cgaccccaat 120 cgctttcgcg gcaaagacct tccggtcctg gaccagctga ccgaccctcc gggggtccgg 180 cgcgtgtacc acatccaggc gggcctaccg gacccgttcc agccccccag cctcccgatc 240 acggtttact acgccgtgtt ggagcgcgcc tgccgcagcg tgctcctaaa cgcaccgtcg 300 gaggcccccc agattgtccg cggggcctcc gaagacgtcc ggaaacaacc ctacaacctg 360 accatcgctt ggtttcggat gggaggcaac tgtgctatcc ccatcacggt catggagtac 420 accgaatgct cctacaacaa gtctctgggg gcctgtccca tccgaacgca gccccgctgg 480 aactactatg acagcttcag cgccgtcagc gaggataacc tggggttcct gatgcacgcc 540 cccgcgtttg agaccgccgg cacgtacctg cggctcgtga agataaacga ctggacggag 600 attacacagt ttatcctgga gcaccgagcc aagggctcct gtaagtacgc cctcccgctg 660 cgcatccccc cgtcagcctg cctctccccc caggcctacc agcagggggt gacggtggac 720 agcatcggga tgctgccccg cttcatcccc gagaaccagc gcaccgtcgc cgtatacagc 780 ttgaagatcg ccgggtggca cgggcccaag gccccataca cgagcaccct gctgcccccg 840 gagctgtccg agacccccaa cgccacgcag ccagaactcg ccccggaaga ccccgaggat 900 tcggccctct tggaggaccc cgtggggacg gtggcgccgc aaatcccacc aaactggcac 960 ataccgtcga tccaggacgc cgcgacgcct taccatcccc cggccacccc gaacaacatg 1020 ggcctgatcg ccggcgcggt gggcggcagt ctcctggcag ccctggtcat ttgcggaatt 1080 gtgtactgga tgcgccgcca cactcaaaaa gccccaaagc gcatacgcct cccccacatc 1140 cgggaagacg accagccgtc ctcgcaccag cccttgtttt actag 1185 <210> 470 <211> 394 <212> PRT <213> Simplexvirus Herpes simplex virus 1 <400> 470 Met Gly Gly Ala Ala Ala Arg Leu Gly Ala Val Ile Leu Phe Val Val 1 5 10 15 Ile Val Gly Leu His Gly Val Arg Ser Lys Tyr Ala Leu Val Asp Ala 20 25 30 Ser Leu Lys Met Ala Asp Pro Asn Arg Phe Arg Gly Lys Asp Leu Pro 35 40 45 Val Leu Asp Gln Leu Thr Asp Pro Pro Gly Val Arg Arg Val Tyr His 50 55 60 Ile Gln Ala Gly Leu Pro Asp Pro Phe Gln Pro Pro Ser Leu Pro Ile 65 70 75 80 Thr Val Tyr Tyr Ala Val Leu Glu Arg Ala Cys Arg Ser Val Leu Leu 85 90 95 Asn Ala Pro Ser Glu Ala Pro Gln Ile Val Arg Gly Ala Ser Glu Asp 100 105 110 Val Arg Lys Gln Pro Tyr Asn Leu Thr Ile Ala Trp Phe Arg Met Gly 115 120 125 Gly Asn Cys Ala Ile Pro Ile Thr Val Met Glu Tyr Thr Glu Cys Ser 130 135 140 Tyr Asn Lys Ser Leu Gly Ala Cys Pro Ile Arg Thr Gln Pro Arg Trp 145 150 155 160 Asn Tyr Tyr Asp Ser Phe Ser Ala Val Ser Glu Asp Asn Leu Gly Phe 165 170 175 Leu Met His Ala Pro Ala Phe Glu Thr Ala Gly Thr Tyr Leu Arg Leu 180 185 190 Val Lys Ile Asn Asp Trp Thr Glu Ile Thr Gln Phe Ile Leu Glu His 195 200 205 Arg Ala Lys Gly Ser Cys Lys Tyr Ala Leu Pro Leu Arg Ile Pro Pro 210 215 220 Ser Ala Cys Leu Ser Pro Gln Ala Tyr Gln Gln Gly Val Thr Val Asp 225 230 235 240 Ser Ile Gly Met Leu Pro Arg Phe Ile Pro Glu Asn Gln Arg Thr Val 245 250 255 Ala Val Tyr Ser Leu Lys Ile Ala Gly Trp His Gly Pro Lys Ala Pro 260 265 270 Tyr Thr Ser Thr Leu Leu Pro Pro Glu Leu Ser Glu Thr Pro Asn Ala 275 280 285 Thr Gln Pro Glu Leu Ala Pro Glu Asp Pro Glu Asp Ser Ala Leu Leu 290 295 300 Glu Asp Pro Val Gly Thr Val Ala Pro Gln Ile Pro Pro Asn Trp His 305 310 315 320 Ile Pro Ser Ile Gln Asp Ala Ala Thr Pro Tyr His Pro Pro Ala Thr 325 330 335 Pro Asn Asn Met Gly Leu Ile Ala Gly Ala Val Gly Gly Ser Leu Leu 340 345 350 Ala Ala Leu Val Ile Cys Gly Ile Val Tyr Trp Met Arg Arg His Thr 355 360 365 Gln Lys Ala Pro Lys Arg Ile Arg Leu Pro His Ile Arg Glu Asp Asp 370 375 380 Gln Pro Ser Ser His Gln Pro Leu Phe Tyr 385 390 <210> 471 <211> 2517 <212> DNA <213> Simplexvirus Herpes simplex virus 1 <400> 471 atgggaaacg gcttgtggtt tgttggtgtg ataatcctgg gagtagcctg gggccaagta 60 catgattgga cagaacaaac cgatccttgg ttcctggacg gacttgggat ggatcggatg 120 tattggcgag atacaaatac tggaagactc tggcttccta atacaccaga tcctcagaag 180 ccacccaggg gcttccttgc tccaccagat gagctcaatc ttacaacagc tagtctcccg 240 ctgctgagat ggtatgaaga acggttctgc ttcgtgctgg taacaaccgc tgaattccct 300 cgcgatccag gacaattgtt gtatattccc aaaacatatc ttctgggtcg accacccaat 360 gcctctctcc cagcacctac tacagtggaa ccaacagctc aacccccgcc gtccgtggct 420 cctctgaaag ggcttctgca taaccccgta gcatcagtct tgctccgcag tcgtgcgtgg 480 gtcacattca gcgctgtgcc cgatcctgaa gcactcactt ttcccagggg cgataatgtc 540 gccacagcat ctcatccttc tggaccacgc gacactccac cccctcgccc acctgtcggc 600 gctcgcaggc atcccacaac agaacttgat attactcatc ttcataatgc ctcaactaca 660 tggctggcta caagagggct tctgcggagc cccgggagat atgtctactt ttctccctct 720 gcttctacat ggccagttgg aatatggaca actggtgaac ttgtccttgg ttgtgacgca 780 gcacttgtca gggcccggta tggtcgcgag tttatgggac tggtcatctc aatgcatgat 840 tcaccgccag tcgaggtcat ggttgtgccg gccggtcaaa cactggaccg agtgggagat 900 cctgcagatg aaaatccacc tggcgccctg ccaggcccac ccggtggacc aaggtaccgc 960 gtgttcgtgc tcggttcact cacccgtgca gataatggta gcgccttgga tgcactgaga 1020 cgtgtcggtg ggtatcctga agaagggacc aattatgcac aatttctcag tagggcgtat 1080 gctgaattct ttagcggaga tgctggagct gaacaagggc cacggccacc cttgttttgg 1140 cggctcactg gactcctggc cacctctgga ttcgcatttg tcaatgctgc tcatgccaat 1200 ggggctgtat gtctgtctga tctcttgggg ttccttgctc atagtcgagc cctcgcaggc 1260 ctggctgctc ggggagctgc cggttgcgca gccgacagtg tcttcttcaa cgtttccgtg 1320 cttgacccga ctgcaagact tcaactggaa gcaagattgc aacatctcgt tgcagaaatc 1380 ttggaaaggg agcaatccct ggctctgcat gcactcggat accaactcgc atttgtactt 1440 gactcccctt ccgcctatga tgccgttgca ccttctgccg ctcacctgat tgatgcattg 1500 tacgcagaat tcctcggcgg aagggttctt actactccag tggtgcatag ggccttgttc 1560 tatgcttctg cggtattgag acaaccattt ctggccggag tgcctagcgc cgtccaaagg 1620 gagcgagcta ggagatcact cctgattgcc tctgcactct gcacatctga tgtagcagcc 1680 gccacaaatg ctgatctgag gactgccctc gctagagctg atcatcaaaa gacgcttttc 1740 tggctccccg atcatttcag tccttgtgca gcgtcactta gattcgacct tgatgaatca 1800 gtcttcatat tggatgcact cgcccaggca actagatctg aaacacctgt tgaggtgctc 1860 gctcaacaaa cacatggttt ggcttctaca ctcacaaggt gggcccatta taatgcattg 1920 attcgggctt ttgtgcccga agcgtcccac cgatgtggcg gacaatcagc aaatgtggaa 1980 cccaggatat tggtgcctat tacgcataat gcttcttatg tggttacgca tagcccattg 2040 ccacgcggca ttgggtataa actgacgggt gtggatgttc gcagacctct gtttctgact 2100 tatctgacag caacctgtga gggttctact cgcgacattg aaagcaaacg tctcgtaagg 2160 acgcagaatc aaagagattt gggtctggtt ggcgctgttt tcatgaggta tactcccgca 2220 ggcgaagtta tgagcgtcct gctcgtcgac accgataata cccaacaaca gattgcagcg 2280 ggccccacag aaggggctcc atcagtcttc tccagcgatg ttccttcaac cgcgctgctc 2340 ctgttcccga atggcacggt tatccacctg ttggcgttcg atacacaacc tgtcgcagcc 2400 atcgcaccgg gattcttggc tgcatccgcc ctcggggttg tgatgataac agcagctctc 2460 gcggggatac tgaaagtgct gcgcaccagc gtgcccttct tctggcgacg agagtga 2517 <210> 472 <211> 838 <212> PRT <213> Simplexvirus Herpes simplex virus 1 <400> 472 Met Gly Asn Gly Leu Trp Phe Val Gly Val Ile Ile Leu Gly Val Ala 1 5 10 15 Trp Gly Gln Val His Asp Trp Thr Glu Gln Thr Asp Pro Trp Phe Leu 20 25 30 Asp Gly Leu Gly Met Asp Arg Met Tyr Trp Arg Asp Thr Asn Thr Gly 35 40 45 Arg Leu Trp Leu Pro Asn Thr Pro Asp Pro Gln Lys Pro Pro Arg Gly 50 55 60 Phe Leu Ala Pro Pro Asp Glu Leu Asn Leu Thr Thr Ala Ser Leu Pro 65 70 75 80 Leu Leu Arg Trp Tyr Glu Glu Arg Phe Cys Phe Val Leu Val Thr Thr 85 90 95 Ala Glu Phe Pro Arg Asp Pro Gly Gln Leu Leu Tyr Ile Pro Lys Thr 100 105 110 Tyr Leu Leu Gly Arg Pro Pro Asn Ala Ser Leu Pro Ala Pro Thr Thr 115 120 125 Val Glu Pro Thr Ala Gln Pro Pro Pro Ser Val Ala Pro Leu Lys Gly 130 135 140 Leu Leu His Asn Pro Val Ala Ser Val Leu Leu Arg Ser Arg Ala Trp 145 150 155 160 Val Thr Phe Ser Ala Val Pro Asp Pro Glu Ala Leu Thr Phe Pro Arg 165 170 175 Gly Asp Asn Val Ala Thr Ala Ser His Pro Ser Gly Pro Arg Asp Thr 180 185 190 Pro Pro Pro Arg Pro Pro Val Gly Ala Arg Arg His Pro Thr Thr Glu 195 200 205 Leu Asp Ile Thr His Leu His Asn Ala Ser Thr Thr Trp Leu Ala Thr 210 215 220 Arg Gly Leu Leu Arg Ser Pro Gly Arg Tyr Val Tyr Phe Ser Pro Ser 225 230 235 240 Ala Ser Thr Trp Pro Val Gly Ile Trp Thr Thr Gly Glu Leu Val Leu 245 250 255 Gly Cys Asp Ala Ala Leu Val Arg Ala Arg Tyr Gly Arg Glu Phe Met 260 265 270 Gly Leu Val Ile Ser Met His Asp Ser Pro Pro Val Glu Val Met Val 275 280 285 Val Pro Ala Gly Gln Thr Leu Asp Arg Val Gly Asp Pro Ala Asp Glu 290 295 300 Asn Pro Pro Gly Ala Leu Pro Gly Pro Pro Gly Gly Pro Arg Tyr Arg 305 310 315 320 Val Phe Val Leu Gly Ser Leu Thr Arg Ala Asp Asn Gly Ser Ala Leu 325 330 335 Asp Ala Leu Arg Arg Val Gly Gly Tyr Pro Glu Glu Gly Thr Asn Tyr 340 345 350 Ala Gln Phe Leu Ser Arg Ala Tyr Ala Glu Phe Phe Ser Gly Asp Ala 355 360 365 Gly Ala Glu Gln Gly Pro Arg Pro Pro Leu Phe Trp Arg Leu Thr Gly 370 375 380 Leu Leu Ala Thr Ser Gly Phe Ala Phe Val Asn Ala Ala His Ala Asn 385 390 395 400 Gly Ala Val Cys Leu Ser Asp Leu Leu Gly Phe Leu Ala His Ser Arg 405 410 415 Ala Leu Ala Gly Leu Ala Ala Arg Gly Ala Ala Gly Cys Ala Ala Asp 420 425 430 Ser Val Phe Phe Asn Val Ser Val Leu Asp Pro Thr Ala Arg Leu Gln 435 440 445 Leu Glu Ala Arg Leu Gln His Leu Val Ala Glu Ile Leu Glu Arg Glu 450 455 460 Gln Ser Leu Ala Leu His Ala Leu Gly Tyr Gln Leu Ala Phe Val Leu 465 470 475 480 Asp Ser Pro Ser Ala Tyr Asp Ala Val Ala Pro Ser Ala Ala His Leu 485 490 495 Ile Asp Ala Leu Tyr Ala Glu Phe Leu Gly Gly Arg Val Leu Thr Thr 500 505 510 Pro Val Val His Arg Ala Leu Phe Tyr Ala Ser Ala Val Leu Arg Gln 515 520 525 Pro Phe Leu Ala Gly Val Pro Ser Ala Val Gln Arg Glu Arg Ala Arg 530 535 540 Arg Ser Leu Leu Ile Ala Ser Ala Leu Cys Thr Ser Asp Val Ala Ala 545 550 555 560 Ala Thr Asn Ala Asp Leu Arg Thr Ala Leu Ala Arg Ala Asp His Gln 565 570 575 Lys Thr Leu Phe Trp Leu Pro Asp His Phe Ser Pro Cys Ala Ala Ser 580 585 590 Leu Arg Phe Asp Leu Asp Glu Ser Val Phe Ile Leu Asp Ala Leu Ala 595 600 605 Gln Ala Thr Arg Ser Glu Thr Pro Val Glu Val Leu Ala Gln Gln Thr 610 615 620 His Gly Leu Ala Ser Thr Leu Thr Arg Trp Ala His Tyr Asn Ala Leu 625 630 635 640 Ile Arg Ala Phe Val Pro Glu Ala Ser His Arg Cys Gly Gly Gln Ser 645 650 655 Ala Asn Val Glu Pro Arg Ile Leu Val Pro Ile Thr His Asn Ala Ser 660 665 670 Tyr Val Val Thr His Ser Pro Leu Pro Arg Gly Ile Gly Tyr Lys Leu 675 680 685 Thr Gly Val Asp Val Arg Arg Pro Leu Phe Leu Thr Tyr Leu Thr Ala 690 695 700 Thr Cys Glu Gly Ser Thr Arg Asp Ile Glu Ser Lys Arg Leu Val Arg 705 710 715 720 Thr Gln Asn Gln Arg Asp Leu Gly Leu Val Gly Ala Val Phe Met Arg 725 730 735 Tyr Thr Pro Ala Gly Glu Val Met Ser Val Leu Leu Val Asp Thr Asp 740 745 750 Asn Thr Gln Gln Gln Ile Ala Ala Gly Pro Thr Glu Gly Ala Pro Ser 755 760 765 Val Phe Ser Ser Asp Val Pro Ser Thr Ala Leu Leu Leu Phe Pro Asn 770 775 780 Gly Thr Val Ile His Leu Leu Ala Phe Asp Thr Gln Pro Val Ala Ala 785 790 795 800 Ile Ala Pro Gly Phe Leu Ala Ala Ser Ala Leu Gly Val Val Met Ile 805 810 815 Thr Ala Ala Leu Ala Gly Ile Leu Lys Val Leu Arg Thr Ser Val Pro 820 825 830 Phe Phe Trp Arg Arg Glu 835 <210> 473 <211> 675 <212> DNA <213> Simplexvirus Herpes simplex virus 1 <400> 473 atggggattt tgggttgggt cgggcttatt gccgttgggg ttttgtgtgt gcgggggggc 60 ttgccttcaa ccgaatatgt tattcggagt cgggtggctc gagaggtggg ggatatatta 120 aaggtgcctt gtgtgccgct cccgtctgac gatcttgatt ggcgttacga gaccccctcg 180 gctataaact atgctttgat agacggtata tttttgcgtt atcactgtcc cggattggac 240 acggtcttgt gggataggca tgcccagaag gcatattggg ttaacccctt tttatttgtg 300 gcgggttttt tggaggactt gagttacccc gcgtttcctg ccaacaccca ggaaacagaa 360 acgcgcttgg ccctttataa agagatacgc caggcgctgg acagtcgcaa gcaggccgcc 420 agccacacac ctgtgaaggc tgggtgtgtg aactttgact attcgcgcac ccgccgctgt 480 gtagggcgac aggatttggg acctaccaac ggaacgtctg gacggacccc ggttctgccg 540 ccggacgatg aagcgggcct gcagccgaag cccctcacca cgccgccgcc catcatcgcc 600 acgtcggacc ccaccccgcg acgggacgcc gccacaaaaa gcagacgccg acgaccccac 660 tcccggcgcc tctaa 675 <210> 474 <211> 224 <212> PRT <213> Simplexvirus Herpes simplex virus 1 <400> 474 Met Gly Ile Leu Gly Trp Val Gly Leu Ile Ala Val Gly Val Leu Cys 1 5 10 15 Val Arg Gly Gly Leu Pro Ser Thr Glu Tyr Val Ile Arg Ser Arg Val 20 25 30 Ala Arg Glu Val Gly Asp Ile Leu Lys Val Pro Cys Val Pro Leu Pro 35 40 45 Ser Asp Asp Leu Asp Trp Arg Tyr Glu Thr Pro Ser Ala Ile Asn Tyr 50 55 60 Ala Leu Ile Asp Gly Ile Phe Leu Arg Tyr His Cys Pro Gly Leu Asp 65 70 75 80 Thr Val Leu Trp Asp Arg His Ala Gln Lys Ala Tyr Trp Val Asn Pro 85 90 95 Phe Leu Phe Val Ala Gly Phe Leu Glu Asp Leu Ser Tyr Pro Ala Phe 100 105 110 Pro Ala Asn Thr Gln Glu Thr Glu Thr Arg Leu Ala Leu Tyr Lys Glu 115 120 125 Ile Arg Gln Ala Leu Asp Ser Arg Lys Gln Ala Ala Ser His Thr Pro 130 135 140 Val Lys Ala Gly Cys Val Asn Phe Asp Tyr Ser Arg Thr Arg Arg Cys 145 150 155 160 Val Gly Arg Gln Asp Leu Gly Pro Thr Asn Gly Thr Ser Gly Arg Thr 165 170 175 Pro Val Leu Pro Pro Asp Asp Glu Ala Gly Leu Gln Pro Lys Pro Leu 180 185 190 Thr Thr Pro Pro Pro Ile Ile Ala Thr Ser Asp Pro Thr Pro Arg Arg 195 200 205 Asp Ala Ala Thr Lys Ser Arg Arg Arg Arg Pro His Ser Arg Arg Leu 210 215 220 <210> 475 <211> 1746 <212> DNA <213> Hepacivirus Hepatitis C Virus <400> 475 atgggttgct ctttttctat cttcttactt gcccttctgt cgtgccttac agtgccagcg 60 tctgcggtgg aagttaggaa cgtcagttct agctactatg ccaccaatga ttgctcgaac 120 agcagcatca cctggcaact caacaacgca gttctccacc ttcctggatg cgtcccatgt 180 gagaatgata acggcacctt gcactgctgg atacaagtaa caccaaatgt ggctgtgaaa 240 caccgcggcg cgctcactca taacctgcgg acgcacgtcg atatgatcgt aatggcagct 300 acggtctgtt cggccctgta tgtgggagac atgtgcgggg ccgtgatgat tgtgtcgcag 360 gctctcataa tatcgccaga acgccacaac ttcacccaag agtgcaactg ttccatctac 420 caaggtcata tcactggcca tcgcatggca tgggacatga tgctaaactg gtcaccaact 480 cttaccatga tccttgctta tgccgctcgt gttcccgagc tagtccttga agttgtcttt 540 ggtggtcatt ggggtgtggt atttggcttg gcctatttct ccatgcaggg agcgtgggcc 600 aaggtcattg ccatcctcct tcttgttgcg ggagtggacg cagagactca taccaccggc 660 tcagctgcgg gtcatgccgc aagggggttt gccaacctcc ttagtcctgg ttccaagcaa 720 aaaataagtt tgatcaatac caatggcagc tggcacataa accggaccgc ccttaattgt 780 aatgacagct tgcagacggg tttcctcgct tctttgtttt acgtcaacaa cttcaacagc 840 tctggctgcc ccgagcgcat gtcttcctgc cgtgggctgg acgatttccg catcgggtgg 900 ggaaccctgg aatacgagac caacgtcacc aacgaggagg acatgaggcc gtactgctgg 960 cattaccctc cgaagccttg cggcattatc tcggctagga cagtttgcgg gccggtctac 1020 tgtttcactc ctagccctgt tgttgtgggt actactgacg agcagggctt gcccacctat 1080 agctgggggg aaaatgagac cgatgtcttc ctgttaaata gcacaagacc cccgcaagga 1140 gcttggttcg gctgcacttg gatgaatggg actgggttta ctaagacatg cggtgcacca 1200 ccttgccgca ttaggaggga tttcaacagc accctcgatc tactgtgccc cacagactgc 1260 tttagaaagc acccggacac cacctatctc aagtgtggag cagggccttg gttaaccccc 1320 agatgcctgg tagactaccc ttatagattg tggcattatc cgtgcaccgt aaattttacc 1380 atctttaagg tgcggatgta tgtggggggg gtggagcatc gattgtcagc agcatgcaac 1440 ttcacgcgcg gggaccgctg cagattggag gacagagata ggggtcagca gagcccactg 1500 ctgcattcca ccactgagtg ggcggtatta ccatgctctt tctccgactt accggcactg 1560 tccactggtc tattgcacct ccatcaaaat atcgtggacg tgcagtatct ctatggactt 1620 actccggcta tcacaaaata catcgtgaag tgggagtggg tggttctcct ctttttgctg 1680 ttggcagacg ccagggtctg tgcgtgcctt tggatgctca tcatattggg ccaagccgaa 1740 gcgtaa 1746 <210> 476 <211> 581 <212> PRT <213> Hepacivirus Hepatitis C Virus <400> 476 Met Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu Leu Ser Cys Leu 1 5 10 15 Thr Val Pro Ala Ser Ala Val Glu Val Arg Asn Val Ser Ser Ser Tyr 20 25 30 Tyr Ala Thr Asn Asp Cys Ser Asn Ser Ser Ile Thr Trp Gln Leu Asn 35 40 45 Asn Ala Val Leu His Leu Pro Gly Cys Val Pro Cys Glu Asn Asp Asn 50 55 60 Gly Thr Leu His Cys Trp Ile Gln Val Thr Pro Asn Val Ala Val Lys 65 70 75 80 His Arg Gly Ala Leu Thr His Asn Leu Arg Thr His Val Asp Met Ile 85 90 95 Val Met Ala Ala Thr Val Cys Ser Ala Leu Tyr Val Gly Asp Met Cys 100 105 110 Gly Ala Val Met Ile Val Ser Gln Ala Leu Ile Ile Ser Pro Glu Arg 115 120 125 His Asn Phe Thr Gln Glu Cys Asn Cys Ser Ile Tyr Gln Gly His Ile 130 135 140 Thr Gly His Arg Met Ala Trp Asp Met Met Leu Asn Trp Ser Pro Thr 145 150 155 160 Leu Thr Met Ile Leu Ala Tyr Ala Ala Arg Val Pro Glu Leu Val Leu 165 170 175 Glu Val Val Phe Gly Gly His Trp Gly Val Val Phe Gly Leu Ala Tyr 180 185 190 Phe Ser Met Gln Gly Ala Trp Ala Lys Val Ile Ala Ile Leu Leu Leu 195 200 205 Val Ala Gly Val Asp Ala Glu Thr His Thr Thr Gly Ser Ala Ala Gly 210 215 220 His Ala Ala Arg Gly Phe Ala Asn Leu Leu Ser Pro Gly Ser Lys Gln 225 230 235 240 Lys Ile Ser Leu Ile Asn Thr Asn Gly Ser Trp His Ile Asn Arg Thr 245 250 255 Ala Leu Asn Cys Asn Asp Ser Leu Gln Thr Gly Phe Leu Ala Ser Leu 260 265 270 Phe Tyr Val Asn Asn Phe Asn Ser Ser Gly Cys Pro Glu Arg Met Ser 275 280 285 Ser Cys Arg Gly Leu Asp Asp Phe Arg Ile Gly Trp Gly Thr Leu Glu 290 295 300 Tyr Glu Thr Asn Val Thr Asn Glu Glu Asp Met Arg Pro Tyr Cys Trp 305 310 315 320 His Tyr Pro Pro Lys Pro Cys Gly Ile Ile Ser Ala Arg Thr Val Cys 325 330 335 Gly Pro Val Tyr Cys Phe Thr Pro Ser Pro Val Val Val Gly Thr Thr 340 345 350 Asp Glu Gln Gly Leu Pro Thr Tyr Ser Trp Gly Glu Asn Glu Thr Asp 355 360 365 Val Phe Leu Leu Asn Ser Thr Arg Pro Pro Gln Gly Ala Trp Phe Gly 370 375 380 Cys Thr Trp Met Asn Gly Thr Gly Phe Thr Lys Thr Cys Gly Ala Pro 385 390 395 400 Pro Cys Arg Ile Arg Arg Asp Phe Asn Ser Thr Leu Asp Leu Leu Cys 405 410 415 Pro Thr Asp Cys Phe Arg Lys His Pro Asp Thr Thr Tyr Leu Lys Cys 420 425 430 Gly Ala Gly Pro Trp Leu Thr Pro Arg Cys Leu Val Asp Tyr Pro Tyr 435 440 445 Arg Leu Trp His Tyr Pro Cys Thr Val Asn Phe Thr Ile Phe Lys Val 450 455 460 Arg Met Tyr Val Gly Gly Val Glu His Arg Leu Ser Ala Ala Cys Asn 465 470 475 480 Phe Thr Arg Gly Asp Arg Cys Arg Leu Glu Asp Arg Asp Arg Gly Gln 485 490 495 Gln Ser Pro Leu Leu His Ser Thr Thr Glu Trp Ala Val Leu Pro Cys 500 505 510 Ser Phe Ser Asp Leu Pro Ala Leu Ser Thr Gly Leu Leu His Leu His 515 520 525 Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr Gly Leu Thr Pro Ala Ile 530 535 540 Thr Lys Tyr Ile Val Lys Trp Glu Trp Val Val Leu Leu Phe Leu Leu 545 550 555 560 Leu Ala Asp Ala Arg Val Cys Ala Cys Leu Trp Met Leu Ile Ile Leu 565 570 575 Gly Gln Ala Glu Ala 580 <210> 477 <211> 1575 <212> DNA <213> Lyssavirus Rabies Virus <400> 477 atggttcctc aggctctcct gtttgtaccc cttctggttt ttccattgtg ttttgggaaa 60 ttccctattt acacgatacc agacaagctt ggtccctgga gtccgattga catacatcac 120 ctcagctgcc caaacaattt ggtagtggag gacgaaggat gcaccaacct gtcagggttc 180 tcctacatgg aacttaaagt tggatacatc ttagccataa aagtgaacgg gttcacttgc 240 acaggcgttg tgacggaggc tgaaacctac actaacttcg ttggttatgt cacaaccacg 300 ttcaaaagaa agcatttccg cccaacacca gatgcatgta gagccgcgta caactggaag 360 atggccggtg accccagata tgaagagtct ctacacaatc cgtaccctga ctaccgctgg 420 cttcgaactg taaaaaccac caaggagtct ctcgttatca tatctccaag tgtggcagat 480 ttggacccat atgacagatc ccttcactcg agggtcttcc ctagcgggaa gtgctcagga 540 gtagcggtgt cttctaccta ctgctccact aaccacgatt acaccatttg gatgcccgag 600 aatccgagac tagggatgtc ttgtgacatt tttaccaata gtagagggaa gagagcatcc 660 aaagggagtg agacttgcgg ctttgtagat gaaagaggcc tatataagtc tttaaaagga 720 gcatgcaaac tcaagttatg tggagttcta ggacttagac ttatggatgg aacatgggtc 780 tcgatgcaaa catcaaatga aaccaaatgg tgccctcccg ataagttggt gaacctgcac 840 gactttcgct cagacgaaat tgagcacctt gttgtagagg agttggtcag gaagagagag 900 gagtgtctgg atgcactaga gtccatcatg acaaccaagt cagtgagttt cagacgtctc 960 agtcatttaa gaaaacttgt ccctgggttt ggaaaagcat ataccatatt caacaagacc 1020 ttgatggaag ccgatgctca ctacaagtca gtcagaactt ggaatgagat cctcccttca 1080 aaagggtgtt taagagttgg ggggaggtgt catcctcatg tgaacggggt gtttttcaat 1140 ggtataatat taggacctga cggcaatgtc ttaatcccag agatgcaatc atccctcctc 1200 cagcaacata tggagttgtt ggaatcctcg gttatccccc ttgtgcaccc cctggcagac 1260 ccgtctaccg ttttcaagga cggtgacgag gctgaggatt ttgttgaagt tcaccttccc 1320 gatgtgcaca atcaggtctc aggagttgac ttgggtctcc cgaactgggg gaagtatgta 1380 ttactgagtg caggggccct gactgccttg atgttgataa ttttcctgat gacatgttgt 1440 agaagagtca atcgatcaga acctacgcaa cacaatctca gagggacagg gagggaggtg 1500 tcagtcactc cccaaagcgg gaagatcata tcttcatggg aatcacacaa gagtgggggt 1560 gagaccagac tgtaa 1575 <210> 478 <211> 524 <212> PRT <213> Lyssavirus Rabies Virus <400> 478 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 479 <211> 1569 <212> DNA <213> Lyssavirus Mokola Virus <400> 479 atgaatatac cttgctttgt tgtgattctc agcttagcca ctacacattc tctgggagaa 60 ttccccttgt acacaattcc tgagaagata gagaaatgga ctcccataga catgatccat 120 ctgagttgcc ccaacaacct attatctgag gaagaaggtt gcaatgcaga gtcatccttt 180 acttactttg agctcaagag tggttaccta gctcatcaga aggttccagg gtttacctgt 240 accggggtcg tgaacgaggc agagacatat acaaacttcg tcgggtacgt caccacaacc 300 ttcaaaagga agcactttag gcctacagta gccgcctgtc gtgatgccta caactggaaa 360 gtgtcaggag accccaggta cgaagagtca ctccacactc cttatcctga cagcagttgg 420 ttgaggactg tgactacaac caaagaatca cttctcataa tatcgcccag catcgtggaa 480 atggatattt acggcaggac tctccattcc cccatgtttc cttcaggagt atgttccaac 540 gtatatccct ctgtcccatc ctgtgagact aatcatgatt acacattatg gctgcctgaa 600 gatcctagtt tgagtttggt ctgtgatatc tttacttcca gcaacggaaa gaaggccatg 660 aacgggtcac gcatctgcgg attcaaggat gaaaggggat tctacagatc tttaaagggc 720 gcttgcaagc tgacattgtg tggaagacct ggaattaggt tattcgacgg aacttgggtc 780 tcttttacaa agccggacgt gcacgtatgg tgcactccca accaattgat caatatacac 840 aatgacagac tagatgagat agaacacctg atcgtggaag acatcataaa gaaaagagaa 900 gagtgcttag acaccctgga aacaatactt atgtctcaat ctgttagctt tagaaggttg 960 agccatttcc gaaagttagt tccaggatat gggaaggcct acactatttt aaacggcagc 1020 ctgatggaaa caaatgtcta ctacaaaagg gtcgacaagt gggctgacat cttaccctct 1080 aagggatgtc tgaaagtcgg gcaacaatgc atggaacctg tcaaaggagt cctcttcaat 1140 gggattatca agggcccgga tggccaaatt ttgatccccg agatgcagtc agagcagcta 1200 aagcagcata tggacctgtt gaaggcggct gtgtttcctc tccgacaccc tttaatcagc 1260 cgggaggcag tctttaagaa agacggggat gccgatgatt ttgtggatct ccatatgcct 1320 gatgtccaca agtctgtgtc agatgtcgac ctgggtctgc ctcattgggg tttctggatg 1380 ttgatcgggg caacaatagt agcatttgtg gtcttggtat gtttactccg tgtatgttgt 1440 aagagagtga ggaggagaag atcaggacgt gcaactcagg agatccccct gagctttccc 1500 tctgcccctg ttcctcgagc caaagtggtg tcatcttggg agtcctataa agggcttcca 1560 ggtacatga 1569 <210> 480 <211> 522 <212> PRT <213> Lyssavirus Mokola Virus <400> 480 Met Asn Ile Pro Cys Phe Val Val Ile Leu Ser Leu Ala Thr Thr His 1 5 10 15 Ser Leu Gly Glu Phe Pro Leu Tyr Thr Ile Pro Glu Lys Ile Glu Lys 20 25 30 Trp Thr Pro Ile Asp Met Ile His Leu Ser Cys Pro Asn Asn Leu Leu 35 40 45 Ser Glu Glu Glu Gly Cys Asn Ala Glu Ser Ser Phe Thr Tyr Phe Glu 50 55 60 Leu Lys Ser Gly Tyr Leu Ala His Gln Lys Val Pro Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Asn Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Val Ala Ala 100 105 110 Cys Arg Asp Ala Tyr Asn Trp Lys Val Ser Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Thr Pro Tyr Pro Asp Ser Ser Trp Leu Arg Thr Val 130 135 140 Thr Thr Thr Lys Glu Ser Leu Leu Ile Ile Ser Pro Ser Ile Val Glu 145 150 155 160 Met Asp Ile Tyr Gly Arg Thr Leu His Ser Pro Met Phe Pro Ser Gly 165 170 175 Val Cys Ser Asn Val Tyr Pro Ser Val Pro Ser Cys Glu Thr Asn His 180 185 190 Asp Tyr Thr Leu Trp Leu Pro Glu Asp Pro Ser Leu Ser Leu Val Cys 195 200 205 Asp Ile Phe Thr Ser Ser Asn Gly Lys Lys Ala Met Asn Gly Ser Arg 210 215 220 Ile Cys Gly Phe Lys Asp Glu Arg Gly Phe Tyr Arg Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Thr Leu Cys Gly Arg Pro Gly Ile Arg Leu Phe Asp 245 250 255 Gly Thr Trp Val Ser Phe Thr Lys Pro Asp Val His Val Trp Cys Thr 260 265 270 Pro Asn Gln Leu Ile Asn Ile His Asn Asp Arg Leu Asp Glu Ile Glu 275 280 285 His Leu Ile Val Glu Asp Ile Ile Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Thr Leu Glu Thr Ile Leu Met Ser Gln Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Phe Arg Lys Leu Val Pro Gly Tyr Gly Lys Ala Tyr Thr Ile 325 330 335 Leu Asn Gly Ser Leu Met Glu Thr Asn Val Tyr Tyr Lys Arg Val Asp 340 345 350 Lys Trp Ala Asp Ile Leu Pro Ser Lys Gly Cys Leu Lys Val Gly Gln 355 360 365 Gln Cys Met Glu Pro Val Lys Gly Val Leu Phe Asn Gly Ile Ile Lys 370 375 380 Gly Pro Asp Gly Gln Ile Leu Ile Pro Glu Met Gln Ser Glu Gln Leu 385 390 395 400 Lys Gln His Met Asp Leu Leu Lys Ala Ala Val Phe Pro Leu Arg His 405 410 415 Pro Leu Ile Ser Arg Glu Ala Val Phe Lys Lys Asp Gly Asp Ala Asp 420 425 430 Asp Phe Val Asp Leu His Met Pro Asp Val His Lys Ser Val Ser Asp 435 440 445 Val Asp Leu Gly Leu Pro His Trp Gly Phe Trp Met Leu Ile Gly Ala 450 455 460 Thr Ile Val Ala Phe Val Val Leu Val Cys Leu Leu Arg Val Cys Cys 465 470 475 480 Lys Arg Val Arg Arg Arg Arg Ser Gly Arg Ala Thr Gln Glu Ile Pro 485 490 495 Leu Ser Phe Pro Ser Ala Pro Val Pro Arg Ala Lys Val Val Ser Ser 500 505 510 Trp Glu Ser Tyr Lys Gly Leu Pro Gly Thr 515 520 <210> 481 <211> 1653 <212> DNA <213> Morbillivirus Measles Virus <400> 481 atggggctta aggccagtgt ctcagcgata ttcatgacgg tgctccttac gctccagacc 60 cctactgggc agatccattg gggcaacctg tcaaaaatag gtgtcgtagg gatcggctcc 120 gcatcatata aggtgatgac gcggtccagt caccagagct tggtgattaa gttgatgcct 180 aacatcactc ttctgaataa ttgtacgcgg gtggaaatcg cggagtatcg cagactcttg 240 cgcacggtac tcgagcctat tagggatgcg cttaacgcaa tgacgcagaa catcaggcct 300 gtacaatcag tagcatccag caggaggcat aaacgattcg cgggggttgt cctcgcgggg 360 gctgctctcg gtgttgccac cgctgcccaa attacggcgg gtatagcgct ccatcaatca 420 atgctgaata gccaggcgat agataacctg agagcgtcct tggagacaac taatcaggca 480 atcgaaacca ttagacaagc cggacaggaa atgattttgg ccgtccaggg aattcaagat 540 tacatcaata atgaattgat tccttcaatg aaccaattga gttgtgatct gattggccaa 600 aaactcggtt tgaaattgct gaggtactac acggagatcc tctctctttt tggcccatcc 660 ctccgcgatc caatttcagc agaaatctca atccaagctc tgagttatgc tctcggcggc 720 gatatcaaca aagtccttga aaagctcggt tatagtggtg gggacctgtt gggcatactc 780 gagtcccgag ggatcaaagc gcgaattact cacgtcgaca ctgaaagtta cttcatcgtt 840 ctgtctattg cttatcccac gttgagtgaa atcaagggag ttatagtcca ccgcttggag 900 ggcgtttcat ataatattgg ttcccaagag tggtacacga cagtgccaaa atacgttgcg 960 acccagggct atctcatcag caactttgac gagtcatctt gtactttcat gccagaagga 1020 acagtttgtt cacagaatgc cctgtatcct atgagcccgt tgctccaaga atgtctcagg 1080 ggatctacta aatcatgtgc gaggactctt gtaagcgggt cctttggaaa tcggtttatt 1140 cttagtcaag gaaatctcat agcgaactgt gcgagtattt tgtgtaaatg ttacacgacc 1200 ggtacgatca taaatcaaga cccagacaag attctgacct atattgctgc agactattgc 1260 cccgtggtag aggtaaatgg ggtgactata caggttgggt cacgcaaata tcccgatgcc 1320 gtgtacttgc acaggataga tttgggccct cctattagcc tcgaacgcct ggacgtaggg 1380 acgaacctgg gaaatgcggt cgctaagctc gaagacgcaa aagagctgct cgaatcatcc 1440 gatcagatac tgcggagtat gaagggtctg agttccacaa acattgttta cattcttatt 1500 gccgtttgct tggggggtct gattggcata cccactttga tttgttgttg ccgaggtcgc 1560 tgcaacaaaa aaggggggca ggtcggcatg agtcgaccgg gccttaagcc agacttgaca 1620 ggtacgagta aaagttacgt tcgctccctt tag 1653 <210> 482 <211> 550 <212> PRT <213> Morbillivirus Measles Virus <400> 482 Met Gly Leu Lys Ala Ser Val Ser Ala Ile Phe Met Thr Val Leu Leu 1 5 10 15 Thr Leu Gln Thr Pro Thr Gly Gln Ile His Trp Gly Asn Leu Ser Lys 20 25 30 Ile Gly Val Val Gly Ile Gly Ser Ala Ser Tyr Lys Val Met Thr Arg 35 40 45 Ser Ser His Gln Ser Leu Val Ile Lys Leu Met Pro Asn Ile Thr Leu 50 55 60 Leu Asn Asn Cys Thr Arg Val Glu Ile Ala Glu Tyr Arg Arg Leu Leu 65 70 75 80 Arg Thr Val Leu Glu Pro Ile Arg Asp Ala Leu Asn Ala Met Thr Gln 85 90 95 Asn Ile Arg Pro Val Gln Ser Val Ala Ser Ser Arg Arg His Lys Arg 100 105 110 Phe Ala Gly Val Val Leu Ala Gly Ala Ala Leu Gly Val Ala Thr Ala 115 120 125 Ala Gln Ile Thr Ala Gly Ile Ala Leu His Gln Ser Met Leu Asn Ser 130 135 140 Gln Ala Ile Asp Asn Leu Arg Ala Ser Leu Glu Thr Thr Asn Gln Ala 145 150 155 160 Ile Glu Thr Ile Arg Gln Ala Gly Gln Glu Met Ile Leu Ala Val Gln 165 170 175 Gly Ile Gln Asp Tyr Ile Asn Asn Glu Leu Ile Pro Ser Met Asn Gln 180 185 190 Leu Ser Cys Asp Leu Ile Gly Gln Lys Leu Gly Leu Lys Leu Leu Arg 195 200 205 Tyr Tyr Thr Glu Ile Leu Ser Leu Phe Gly Pro Ser Leu Arg Asp Pro 210 215 220 Ile Ser Ala Glu Ile Ser Ile Gln Ala Leu Ser Tyr Ala Leu Gly Gly 225 230 235 240 Asp Ile Asn Lys Val Leu Glu Lys Leu Gly Tyr Ser Gly Gly Asp Leu 245 250 255 Leu Gly Ile Leu Glu Ser Arg Gly Ile Lys Ala Arg Ile Thr His Val 260 265 270 Asp Thr Glu Ser Tyr Phe Ile Val Leu Ser Ile Ala Tyr Pro Thr Leu 275 280 285 Ser Glu Ile Lys Gly Val Ile Val His Arg Leu Glu Gly Val Ser Tyr 290 295 300 Asn Ile Gly Ser Gln Glu Trp Tyr Thr Thr Val Pro Lys Tyr Val Ala 305 310 315 320 Thr Gln Gly Tyr Leu Ile Ser Asn Phe Asp Glu Ser Ser Cys Thr Phe 325 330 335 Met Pro Glu Gly Thr Val Cys Ser Gln Asn Ala Leu Tyr Pro Met Ser 340 345 350 Pro Leu Leu Gln Glu Cys Leu Arg Gly Ser Thr Lys Ser Cys Ala Arg 355 360 365 Thr Leu Val Ser Gly Ser Phe Gly Asn Arg Phe Ile Leu Ser Gln Gly 370 375 380 Asn Leu Ile Ala Asn Cys Ala Ser Ile Leu Cys Lys Cys Tyr Thr Thr 385 390 395 400 Gly Thr Ile Ile Asn Gln Asp Pro Asp Lys Ile Leu Thr Tyr Ile Ala 405 410 415 Ala Asp Tyr Cys Pro Val Val Glu Val Asn Gly Val Thr Ile Gln Val 420 425 430 Gly Ser Arg Lys Tyr Pro Asp Ala Val Tyr Leu His Arg Ile Asp Leu 435 440 445 Gly Pro Pro Ile Ser Leu Glu Arg Leu Asp Val Gly Thr Asn Leu Gly 450 455 460 Asn Ala Val Ala Lys Leu Glu Asp Ala Lys Glu Leu Leu Glu Ser Ser 465 470 475 480 Asp Gln Ile Leu Arg Ser Met Lys Gly Leu Ser Ser Thr Asn Ile Val 485 490 495 Tyr Ile Leu Ile Ala Val Cys Leu Gly Gly Leu Ile Gly Ile Pro Thr 500 505 510 Leu Ile Cys Cys Cys Arg Gly Arg Cys Asn Lys Lys Gly Gly Gln Val 515 520 525 Gly Met Ser Arg Pro Gly Leu Lys Pro Asp Leu Thr Gly Thr Ser Lys 530 535 540 Ser Tyr Val Arg Ser Leu 545 550 <210> 483 <211> 1854 <212> DNA <213> Morbillivirus Measles Virus <400> 483 atgtcaccac aacgagaccg gataaatgcc ttctacaaag ataaccccca tcccaaggga 60 agtaggatag ttattaatag agaacatctt atgattgata gaccttatgt tttgctggct 120 gttctattcg tcatgtttct gagcttgatc gggttgctag ccattgcagg catcagactt 180 catcgggcag ccatctacac cgcagagatc cataaaagcc tcagcaccaa tctagatgta 240 actaactcaa tcgagcatca ggtcaaggac gtgctgacac cactcttcaa aatcatcggt 300 gatgaagtgg gcctgagaac acctcagaga ttcactgacc tagtgaaatt catctctgac 360 aagattaaat tcctcaatcc ggatagggag tacgacttca gagatctcac ttggtgtatc 420 aacccgccag agagaatcaa attggactat gatcaatact gtgcagatgt ggctgctgaa 480 gagctcatga atgcattggt gaactcaact ctactggaga ctaggacaac caatcagttc 540 ctagctgtct caaagggaaa ctgctcaggg cccactacaa tcagaggtca attctcaaac 600 atgtcgttgt ccctgttgga cttgtatttg agtcgaggtt acaatgtgtc atctatagtc 660 actatgacat cccagggaat gtacggggga acttacctag tggaaaagcc taatctgagc 720 agcaaagggt cagagttgcc acaaccaagc atgcaccgag tgtttgaagt aggtgtcatc 780 agaaatccgg gtttgggggc tccggtgttc catatgacaa actattttga gcagccagtc 840 agcaatgatt tcagcaactg tatggtggct ttgggggagc tcaaactcgc agctctttgc 900 cacggggaag attctatcac aattccctat cagggatcag ggaaaggtgt cagcttccag 960 ctcgtcaagc taggtgtctg gaaatcccca accgacatgc aatcctgggt ccccttatca 1020 acggatgatc cagtgataga caggctttac ctctcatctc acagaggtat tatcgctgac 1080 aatcaagcaa aatgggctgt cccgacaaca cgaacagatg acaagttgcg aatggagaca 1140 tgcttccagc aggcgtgtaa gggtaaaatc caagcactct gcgagaatcc cgagtgggca 1200 ccattgaagg ataacaggat tccttcatac ggggtcttgt ctgttgatct gagcctggca 1260 gttgagctta aaatcaaaat tgcttcagga ttcgggccat tgatcacaca cggttcaggg 1320 atggacctat acaaatccaa ccacaacaat gtgtattggc tgactatccc gccaatgaag 1380 aacctagcct taggtgtaat caacacattg gagtggatac cgagattcaa ggttagtccc 1440 aacctcttta ctgtcccaat taaggaagca ggcgaggact gccatgcccc gacataccta 1500 cctgcggagg tggatggtga tgtcaaactc agttccaatc tggtgattct acctggtcaa 1560 gatctccaat atgttttggc aacctacgat acttccaggg ttgaacatgc tgtggtttat 1620 tacgtttaca gcccaagccg ctcattttct tacttttatc cttttaggtt gcctataaag 1680 ggagtcccca tcgaattaca agtggaatgc ttcacatggg accaaaaact ctggtgccgt 1740 cacttctgtg tgcttgcaga ctcagaatct ggtggacata tcactcactc tgggatggtg 1800 ggtatgggag tcagctgcac agtcactcgg gaagatggaa ccaaccgcgg atag 1854 <210> 484 <211> 617 <212> PRT <213> Morbillivirus Measles Virus <400> 484 Met Ser Pro Gln Arg Asp Arg Ile Asn Ala Phe Tyr Lys Asp Asn Pro 1 5 10 15 His Pro Lys Gly Ser Arg Ile Val Ile Asn Arg Glu His Leu Met Ile 20 25 30 Asp Arg Pro Tyr Val Leu Leu Ala Val Leu Phe Val Met Phe Leu Ser 35 40 45 Leu Ile Gly Leu Leu Ala Ile Ala Gly Ile Arg Leu His Arg Ala Ala 50 55 60 Ile Tyr Thr Ala Glu Ile His Lys Ser Leu Ser Thr Asn Leu Asp Val 65 70 75 80 Thr Asn Ser Ile Glu His Gln Val Lys Asp Val Leu Thr Pro Leu Phe 85 90 95 Lys Ile Ile Gly Asp Glu Val Gly Leu Arg Thr Pro Gln Arg Phe Thr 100 105 110 Asp Leu Val Lys Phe Ile Ser Asp Lys Ile Lys Phe Leu Asn Pro Asp 115 120 125 Arg Glu Tyr Asp Phe Arg Asp Leu Thr Trp Cys Ile Asn Pro Pro Glu 130 135 140 Arg Ile Lys Leu Asp Tyr Asp Gln Tyr Cys Ala Asp Val Ala Ala Glu 145 150 155 160 Glu Leu Met Asn Ala Leu Val Asn Ser Thr Leu Leu Glu Thr Arg Thr 165 170 175 Thr Asn Gln Phe Leu Ala Val Ser Lys Gly Asn Cys Ser Gly Pro Thr 180 185 190 Thr Ile Arg Gly Gln Phe Ser Asn Met Ser Leu Ser Leu Leu Asp Leu 195 200 205 Tyr Leu Ser Arg Gly Tyr Asn Val Ser Ser Ile Val Thr Met Thr Ser 210 215 220 Gln Gly Met Tyr Gly Gly Thr Tyr Leu Val Glu Lys Pro Asn Leu Ser 225 230 235 240 Ser Lys Gly Ser Glu Leu Pro Gln Pro Ser Met His Arg Val Phe Glu 245 250 255 Val Gly Val Ile Arg Asn Pro Gly Leu Gly Ala Pro Val Phe His Met 260 265 270 Thr Asn Tyr Phe Glu Gln Pro Val Ser Asn Asp Phe Ser Asn Cys Met 275 280 285 Val Ala Leu Gly Glu Leu Lys Leu Ala Ala Leu Cys His Gly Glu Asp 290 295 300 Ser Ile Thr Ile Pro Tyr Gln Gly Ser Gly Lys Gly Val Ser Phe Gln 305 310 315 320 Leu Val Lys Leu Gly Val Trp Lys Ser Pro Thr Asp Met Gln Ser Trp 325 330 335 Val Pro Leu Ser Thr Asp Asp Pro Val Ile Asp Arg Leu Tyr Leu Ser 340 345 350 Ser His Arg Gly Ile Ile Ala Asp Asn Gln Ala Lys Trp Ala Val Pro 355 360 365 Thr Thr Arg Thr Asp Asp Lys Leu Arg Met Glu Thr Cys Phe Gln Gln 370 375 380 Ala Cys Lys Gly Lys Ile Gln Ala Leu Cys Glu Asn Pro Glu Trp Ala 385 390 395 400 Pro Leu Lys Asp Asn Arg Ile Pro Ser Tyr Gly Val Leu Ser Val Asp 405 410 415 Leu Ser Leu Ala Val Glu Leu Lys Ile Lys Ile Ala Ser Gly Phe Gly 420 425 430 Pro Leu Ile Thr His Gly Ser Gly Met Asp Leu Tyr Lys Ser Asn His 435 440 445 Asn Asn Val Tyr Trp Leu Thr Ile Pro Pro Met Lys Asn Leu Ala Leu 450 455 460 Gly Val Ile Asn Thr Leu Glu Trp Ile Pro Arg Phe Lys Val Ser Pro 465 470 475 480 Asn Leu Phe Thr Val Pro Ile Lys Glu Ala Gly Glu Asp Cys His Ala 485 490 495 Pro Thr Tyr Leu Pro Ala Glu Val Asp Gly Asp Val Lys Leu Ser Ser 500 505 510 Asn Leu Val Ile Leu Pro Gly Gln Asp Leu Gln Tyr Val Leu Ala Thr 515 520 525 Tyr Asp Thr Ser Arg Val Glu His Ala Val Val Tyr Tyr Val Tyr Ser 530 535 540 Pro Ser Arg Ser Phe Ser Tyr Phe Tyr Pro Phe Arg Leu Pro Ile Lys 545 550 555 560 Gly Val Pro Ile Glu Leu Gln Val Glu Cys Phe Thr Trp Asp Gln Lys 565 570 575 Leu Trp Cys Arg His Phe Cys Val Leu Ala Asp Ser Glu Ser Gly Gly 580 585 590 His Ile Thr His Ser Gly Met Val Gly Met Gly Val Ser Cys Thr Val 595 600 605 Thr Arg Glu Asp Gly Thr Asn Arg Gly 610 615 <210> 485 <211> 2031 <212> DNA <213> Ebolavirus Ebola Zaire Virus <400> 485 atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480 ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900 attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960 cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020 atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080 gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140 aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200 gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260 ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320 actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380 aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440 ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500 agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560 caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620 ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680 ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740 accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800 tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860 gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920 aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980 gttataattg cagttatcgc tttattctgt atatgcaaat ttgtctttta g 2031 <210> 486 <211> 676 <212> PRT <213> Ebolavirus Ebola Zaire Virus <400> 486 Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg 1 5 10 15 Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser 20 25 30 Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val 35 40 45 Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg 50 55 60 Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro 65 70 75 80 Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val 85 90 95 Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu 100 105 110 Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly 115 120 125 Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr 130 135 140 Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe 145 150 155 160 Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe 165 170 175 Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp 180 185 190 Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp 195 200 205 Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly 210 215 220 Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr 225 230 235 240 Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu 245 250 255 Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys 260 265 270 Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp 275 280 285 Ala Phe Trp Glu Thr Lys Lys Asn Leu Thr Arg Lys Ile Arg Ser Glu 290 295 300 Glu Leu Ser Phe Thr Val Val Ser Asn Gly Ala Lys Asn Ile Ser Gly 305 310 315 320 Gln Ser Pro Ala Arg Thr Ser Ser Asp Pro Gly Thr Asn Thr Thr Thr 325 330 335 Glu Asp His Lys Ile Met Ala Ser Glu Asn Ser Ser Ala Met Val Gln 340 345 350 Val His Ser Gln Gly Arg Glu Ala Ala Val Ser His Leu Thr Thr Leu 355 360 365 Ala Thr Ile Ser Thr Ser Pro Gln Ser Leu Thr Thr Lys Pro Gly Pro 370 375 380 Asp Asn Ser Thr His Asn Thr Pro Val Tyr Lys Leu Asp Ile Ser Glu 385 390 395 400 Ala Thr Gln Val Glu Gln His His Arg Arg Thr Asp Asn Asp Ser Thr 405 410 415 Ala Ser Asp Thr Pro Ser Ala Thr Thr Ala Ala Gly Pro Pro Lys Ala 420 425 430 Glu Asn Thr Asn Thr Ser Lys Ser Thr Asp Phe Leu Asp Pro Ala Thr 435 440 445 Thr Thr Ser Pro Gln Asn His Ser Glu Thr Ala Gly Asn Asn Asn Thr 450 455 460 His His Gln Asp Thr Gly Glu Glu Ser Ala Ser Ser Gly Lys Leu Gly 465 470 475 480 Leu Ile Thr Asn Thr Ile Ala Gly Val Ala Gly Leu Ile Thr Gly Gly 485 490 495 Arg Arg Thr Arg Arg Glu Ala Ile Val Asn Ala Gln Pro Lys Cys Asn 500 505 510 Pro Asn Leu His Tyr Trp Thr Thr Gln Asp Glu Gly Ala Ala Ile Gly 515 520 525 Leu Ala Trp Ile Pro Tyr Phe Gly Pro Ala Ala Glu Gly Ile Tyr Ile 530 535 540 Glu Gly Leu Met His Asn Gln Asp Gly Leu Ile Cys Gly Leu Arg Gln 545 550 555 560 Leu Ala Asn Glu Thr Thr Gln Ala Leu Gln Leu Phe Leu Arg Ala Thr 565 570 575 Thr Glu Leu Arg Thr Phe Ser Ile Leu Asn Arg Lys Ala Ile Asp Phe 580 585 590 Leu Leu Gln Arg Trp Gly Gly Thr Cys His Ile Leu Gly Pro Asp Cys 595 600 605 Cys Ile Glu Pro His Asp Trp Thr Lys Asn Ile Thr Asp Lys Ile Asp 610 615 620 Gln Ile Ile His Asp Phe Val Asp Lys Thr Leu Pro Asp Gln Gly Asp 625 630 635 640 Asn Asp Asn Trp Trp Thr Gly Trp Arg Gln Trp Ile Pro Ala Gly Ile 645 650 655 Gly Val Thr Gly Val Ile Ile Ala Val Ile Ala Leu Phe Cys Ile Cys 660 665 670 Lys Phe Val Phe 675 <210> 487 <211> 1485 <212> DNA <213> Flavivirus Dengue Virus <400> 487 atgcggtgcg tgggaatagg aaacagagac ttcgtggaag gactgtcagg agctacgtgg 60 gtggatgtag ttctggagca tggaagttgc gtcactacca tggcaaaaga caaaccaaca 120 ctggacattg aactcctgaa gacggaggtc acaaaccctg ccgtcctgcg caaactgtgt 180 atagaagcta aaatatcaaa taccaccact gactcgagat gtccgacaca aggagaagcc 240 acgctggtgg aagaacaaga cacgaacttt gtgtgtcgac gaacattcgt ggacagaggc 300 tggggcaatg gttgtggact attcggaaag ggtagcttaa taacgtgtgc taagtttaag 360 tgtgtgacaa aattggaagg aaagatagtc caatatgaaa acttaaaata ttctgtgatc 420 gttaccgtcc acactggaga ccagcaccaa gttggaaatg agaccacaga acatggaaca 480 attgcaacca taacacctca agctcccacg tcggaaatac aactgacaga ctacggagct 540 ctaacactgg attgttcacc tagaacaggg ctagacttta atgagatggt gttgctgaca 600 atgaaagaaa aatcatggct cgtccacaaa caatggtttc tagacttacc actgccttgg 660 acctcagggg cctcaacgtc ccaagagact tggaacagac aagacttgct ggtcacgttt 720 aagacagctc atgcaaagaa gcaggaagta gtcgtactag gatcacaaga aggagcaatg 780 cacactgcgt tgactggagc gacagaaatc caaacgtctg gaacgacaac aatttttgca 840 ggccacctga aatgcagatt aaaaatggac aaactaactc taaaaggaat atcatatgta 900 atgtgcacag gctcattcaa gttagagaag gaagtggctg agacccagca tggaactgtt 960 ctagtacagg tcaaatacga aggaacagat gcaccatgca agatcccctt ctcgtcccaa 1020 gatgagaagg gagtaaccca gaatgggaga ttggtaacag ccaaccccat agtcactgac 1080 aaagaaaaac cagtcaacat tgaagcggag ccaccctttg gtgagagcta catcgtggta 1140 ggagcaggtg aaaaagcttt gaaactaagc tggttcaaga agggaagcag tatagggaaa 1200 atgtttgaag caactgcccg tggagcacga aggatggcca tcctgggaga caccgcatgg 1260 gacttcggct ctataggagg agtgttcacg tctgtgggaa aactggtaca ccagatcttt 1320 ggaactgcgt atggagtttt gttcagcggt gtttcttgga ccatgaaaat aggaataggg 1380 attctgctga catggctggg attaaactca aggagcacgt ccctttcaat gacgtgtatc 1440 gcagttggca tggtcacact gtacctagga gtcatggtcc aggcg 1485 <210> 488 <211> 495 <212> PRT <213> Flavivirus Dengue Virus <400> 488 Met Arg Cys Val Gly Ile Gly Asn Arg Asp Phe Val Glu Gly Leu Ser 1 5 10 15 Gly Ala Thr Trp Val Asp Val Val Leu Glu His Gly Ser Cys Val Thr 20 25 30 Thr Met Ala Lys Asp Lys Pro Thr Leu Asp Ile Glu Leu Leu Lys Thr 35 40 45 Glu Val Thr Asn Pro Ala Val Leu Arg Lys Leu Cys Ile Glu Ala Lys 50 55 60 Ile Ser Asn Thr Thr Thr Asp Ser Arg Cys Pro Thr Gln Gly Glu Ala 65 70 75 80 Thr Leu Val Glu Glu Gln Asp Thr Asn Phe Val Cys Arg Arg Thr Phe 85 90 95 Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser 100 105 110 Leu Ile Thr Cys Ala Lys Phe Lys Cys Val Thr Lys Leu Glu Gly Lys 115 120 125 Ile Val Gln Tyr Glu Asn Leu Lys Tyr Ser Val Ile Val Thr Val His 130 135 140 Thr Gly Asp Gln His Gln Val Gly Asn Glu Thr Thr Glu His Gly Thr 145 150 155 160 Ile Ala Thr Ile Thr Pro Gln Ala Pro Thr Ser Glu Ile Gln Leu Thr 165 170 175 Asp Tyr Gly Ala Leu Thr Leu Asp Cys Ser Pro Arg Thr Gly Leu Asp 180 185 190 Phe Asn Glu Met Val Leu Leu Thr Met Lys Glu Lys Ser Trp Leu Val 195 200 205 His Lys Gln Trp Phe Leu Asp Leu Pro Leu Pro Trp Thr Ser Gly Ala 210 215 220 Ser Thr Ser Gln Glu Thr Trp Asn Arg Gln Asp Leu Leu Val Thr Phe 225 230 235 240 Lys Thr Ala His Ala Lys Lys Gln Glu Val Val Val Leu Gly Ser Gln 245 250 255 Glu Gly Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Thr 260 265 270 Ser Gly Thr Thr Thr Ile Phe Ala Gly His Leu Lys Cys Arg Leu Lys 275 280 285 Met Asp Lys Leu Thr Leu Lys Gly Ile Ser Tyr Val Met Cys Thr Gly 290 295 300 Ser Phe Lys Leu Glu Lys Glu Val Ala Glu Thr Gln His Gly Thr Val 305 310 315 320 Leu Val Gln Val Lys Tyr Glu Gly Thr Asp Ala Pro Cys Lys Ile Pro 325 330 335 Phe Ser Ser Gln Asp Glu Lys Gly Val Thr Gln Asn Gly Arg Leu Val 340 345 350 Thr Ala Asn Pro Ile Val Thr Asp Lys Glu Lys Pro Val Asn Ile Glu 355 360 365 Ala Glu Pro Pro Phe Gly Glu Ser Tyr Ile Val Val Gly Ala Gly Glu 370 375 380 Lys Ala Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser Ile Gly Lys 385 390 395 400 Met Phe Glu Ala Thr Ala Arg Gly Ala Arg Arg Met Ala Ile Leu Gly 405 410 415 Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly Gly Val Phe Thr Ser Val 420 425 430 Gly Lys Leu Val His Gln Ile Phe Gly Thr Ala Tyr Gly Val Leu Phe 435 440 445 Ser Gly Val Ser Trp Thr Met Lys Ile Gly Ile Gly Ile Leu Leu Thr 450 455 460 Trp Leu Gly Leu Asn Ser Arg Ser Thr Ser Leu Ser Met Thr Cys Ile 465 470 475 480 Ala Val Gly Met Val Thr Leu Tyr Leu Gly Val Met Val Gln Ala 485 490 495 <210> 489 <211> 1518 <212> DNA <213> Flavivirus Zika virus <400> 489 atgatcaggt gcataggagt cagcaatagg gactttgtgg aaggtatgtc aggtgggact 60 tgggttgatg ttgtcttgga acatggaggt tgtgtcaccg taatggcaca ggacaaaccg 120 actgtcgaca tagagctggt tacaacaaca gtcagcaaca tggcggaggt aagatcctac 180 tgctatgagg catcaatatc agacatggct tcggacagcc gctgcccaac acaaggtgaa 240 gcctaccttg acaagcaatc agacactcaa tatgtctgca aaagaacgtt agtggacaga 300 ggctggggaa atggatgtgg actttttggc aaagggagcc tggtgacatg cgctaagttt 360 gcatgctcca agaaaatgac cgggaagagc atccagccag agaatctgga gtaccggata 420 atgctgtcag ttcatggctc ccagcacagt gggatgatcg ttaatgacac aggacatgaa 480 actgatgaga atagagcgaa ggttgagata acgcccaatt caccaagagc cgaagccacc 540 ctggggggtt ttggaagcct aggacttgat tgtgaaccga ggacaggcct tgacttttca 600 gatttgtatt acttgactat gaataacaag cactggttgg tccacaagga gtggttccac 660 gacattccat taccttggca cgctggggca gacaccggaa ctccacactg gaacaacaaa 720 gaagcactgg tagagttcaa ggacgcacat gccaaaaggc aaactgtcgt ggttctaggg 780 agtcaagaag gagcagttca cacggccctt gctggagctc tggaggctga gatggatggt 840 gcaaagggaa ggctgtcctc tggccacttg aaatgtcgcc tgaaaatgga taaacttaga 900 ttgaagggcg tgtcatactc cttgtgtacc gcagcgttca cattcaccaa gatcccggct 960 gaaacactgc acgggacagt cacagtggag gtacagtacg cagggacaga tggaccttgc 1020 aaggttccag ctcagatggc ggtggacatg caaactctga ccccagttgg gaggttgata 1080 accgctaacc ccgtaatcac tgaaagcact gagaactcta agatgatgct ggaacttgat 1140 ccaccatttg gggactctta cattgtcata ggagtcgggg agaagaagat cacccaccac 1200 tggcacagga gtggcagcac cattggaaaa gcatttgaag ccactgtgag aggtgccaag 1260 agaatggcag tcttgggaga cacagcctgg gactttggat cagttggagg cgctctcaac 1320 tcattgggca agggcatcca tcaaattttt ggagcagctt tcaaatcatt gtttggagga 1380 atgtcctggt tctcacaaat cctcattgga acgttgctga tgtggttggg tctgaacaca 1440 aagaatggat ctatttccct tatgtgcttg gccttagggg gagtgttgat cttcttatcc 1500 acagccgtct ctgcttag 1518 <210> 490 <211> 505 <212> PRT <213> Flavivirus Zika virus <400> 490 Met Ile Arg Cys Ile Gly Val Ser Asn Arg Asp Phe Val Glu Gly Met 1 5 10 15 Ser Gly Gly Thr Trp Val Asp Val Val Leu Glu His Gly Gly Cys Val 20 25 30 Thr Val Met Ala Gln Asp Lys Pro Thr Val Asp Ile Glu Leu Val Thr 35 40 45 Thr Thr Val Ser Asn Met Ala Glu Val Arg Ser Tyr Cys Tyr Glu Ala 50 55 60 Ser Ile Ser Asp Met Ala Ser Asp Ser Arg Cys Pro Thr Gln Gly Glu 65 70 75 80 Ala Tyr Leu Asp Lys Gln Ser Asp Thr Gln Tyr Val Cys Lys Arg Thr 85 90 95 Leu Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly 100 105 110 Ser Leu Val Thr Cys Ala Lys Phe Ala Cys Ser Lys Lys Met Thr Gly 115 120 125 Lys Ser Ile Gln Pro Glu Asn Leu Glu Tyr Arg Ile Met Leu Ser Val 130 135 140 His Gly Ser Gln His Ser Gly Met Ile Val Asn Asp Thr Gly His Glu 145 150 155 160 Thr Asp Glu Asn Arg Ala Lys Val Glu Ile Thr Pro Asn Ser Pro Arg 165 170 175 Ala Glu Ala Thr Leu Gly Gly Phe Gly Ser Leu Gly Leu Asp Cys Glu 180 185 190 Pro Arg Thr Gly Leu Asp Phe Ser Asp Leu Tyr Tyr Leu Thr Met Asn 195 200 205 Asn Lys His Trp Leu Val His Lys Glu Trp Phe His Asp Ile Pro Leu 210 215 220 Pro Trp His Ala Gly Ala Asp Thr Gly Thr Pro His Trp Asn Asn Lys 225 230 235 240 Glu Ala Leu Val Glu Phe Lys Asp Ala His Ala Lys Arg Gln Thr Val 245 250 255 Val Val Leu Gly Ser Gln Glu Gly Ala Val His Thr Ala Leu Ala Gly 260 265 270 Ala Leu Glu Ala Glu Met Asp Gly Ala Lys Gly Arg Leu Ser Ser Gly 275 280 285 His Leu Lys Cys Arg Leu Lys Met Asp Lys Leu Arg Leu Lys Gly Val 290 295 300 Ser Tyr Ser Leu Cys Thr Ala Ala Phe Thr Phe Thr Lys Ile Pro Ala 305 310 315 320 Glu Thr Leu His Gly Thr Val Thr Val Glu Val Gln Tyr Ala Gly Thr 325 330 335 Asp Gly Pro Cys Lys Val Pro Ala Gln Met Ala Val Asp Met Gln Thr 340 345 350 Leu Thr Pro Val Gly Arg Leu Ile Thr Ala Asn Pro Val Ile Thr Glu 355 360 365 Ser Thr Glu Asn Ser Lys Met Met Leu Glu Leu Asp Pro Pro Phe Gly 370 375 380 Asp Ser Tyr Ile Val Ile Gly Val Gly Glu Lys Lys Ile Thr His His 385 390 395 400 Trp His Arg Ser Gly Ser Thr Ile Gly Lys Ala Phe Glu Ala Thr Val 405 410 415 Arg Gly Ala Lys Arg Met Ala Val Leu Gly Asp Thr Ala Trp Asp Phe 420 425 430 Gly Ser Val Gly Gly Ala Leu Asn Ser Leu Gly Lys Gly Ile His Gln 435 440 445 Ile Phe Gly Ala Ala Phe Lys Ser Leu Phe Gly Gly Met Ser Trp Phe 450 455 460 Ser Gln Ile Leu Ile Gly Thr Leu Leu Met Trp Leu Gly Leu Asn Thr 465 470 475 480 Lys Asn Gly Ser Ile Ser Leu Met Cys Leu Ala Leu Gly Gly Val Leu 485 490 495 Ile Phe Leu Ser Thr Ala Val Ser Ala 500 505 <210> 491 <211> 1284 <212> DNA <213> Flavivirus West Nile Virus <400> 491 atgttcaact gccttggaat gagcaacaga gacttcttgg aaggagtgtc tggagcaaca 60 tgggtggatt tggttctcga aggcgacagc tgcgtgacta tcatgtctaa ggacaagcct 120 accatcgatg tgaagatgat gaatatggag gcggccaacc tggcagaggt ccgcagttat 180 tgctatttgg ctaccgtcag cgatctctcc accaaagctg cgtgcccgac catgggagaa 240 gctcacaatg acaaacgtgc tgacccagct tttgtgtgca gacaaggagt ggtggacagg 300 ggctggggca acggctgcgg actatttggc aaaggaagca ttgacacatg cgccaaattt 360 gcctgctcta ccaaggcaat aggaagaacc atcttgaaag agaatatcaa gtacgaagtg 420 gccatttttg tccatggacc aactactgtg gagtcgcacg gaaactactc cacacaggtt 480 ggagccactc aggcagggag attcagcatc actcctgcgg cgccttcata cacactaaag 540 cttggagaat atggagaggt gacagtggac tgtgaaccac ggtcagggat tgacaccaat 600 gcatactacg tgatgactgt tggaacaaag acgttcttgg tccatcgtga gtggttcatg 660 gacctcaacc tcccttggag cagtgctgga agtactgtgt ggaggaacag agagacgtta 720 atggagtttg aagaaccaca cgccacgaag cagtctgtga tagcattggg ctcacaagag 780 ggagctctgc atcaagcttt ggctggagcc attcctgtgg aattttcaag caacactgtc 840 aagttgacgt cgggtcattt gaagtgtaga gtgaagatgg aaaaattgca gttgaaggga 900 acaacctatg gcgtctgttc aaaggctttc aagtttcttg ggactcccgc agacacaggt 960 cacggcactg tggtgttgga attgcagtac actggcacgg atggaccttg caaagttcct 1020 atctcgtcag tggcttcatt gaacgaccta acgccagtgg gcagattggt cactgtcaac 1080 ccttttgttt cagtggccac ggccaacgct aaggtcctga ttgaattgga accacccttt 1140 ggagactcat acatagtggt gggcagagga gaacaacaga tcaatcacca ttggcacaag 1200 tctggaagca gcattggcaa agcctttaca accaccctca aaggagcgca gagactagcc 1260 gctctaggag acacagcttg gtag 1284 <210> 492 <211> 427 <212> PRT <213> Flavivirus West Nile Virus <400> 492 Met Phe Asn Cys Leu Gly Met Ser Asn Arg Asp Phe Leu Glu Gly Val 1 5 10 15 Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Val 20 25 30 Thr Ile Met Ser Lys Asp Lys Pro Thr Ile Asp Val Lys Met Met Asn 35 40 45 Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala 50 55 60 Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu 65 70 75 80 Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gln Gly 85 90 95 Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly 100 105 110 Ser Ile Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala Ile Gly 115 120 125 Arg Thr Ile Leu Lys Glu Asn Ile Lys Tyr Glu Val Ala Ile Phe Val 130 135 140 His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gln Val 145 150 155 160 Gly Ala Thr Gln Ala Gly Arg Phe Ser Ile Thr Pro Ala Ala Pro Ser 165 170 175 Tyr Thr Leu Lys Leu Gly Glu Tyr Gly Glu Val Thr Val Asp Cys Glu 180 185 190 Pro Arg Ser Gly Ile Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly 195 200 205 Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn Leu 210 215 220 Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr Leu 225 230 235 240 Met Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Ile Ala Leu 245 250 255 Gly Ser Gln Glu Gly Ala Leu His Gln Ala Leu Ala Gly Ala Ile Pro 260 265 270 Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys 275 280 285 Cys Arg Val Lys Met Glu Lys Leu Gln Leu Lys Gly Thr Thr Tyr Gly 290 295 300 Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly 305 310 315 320 His Gly Thr Val Val Leu Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro 325 330 335 Cys Lys Val Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro 340 345 350 Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala 355 360 365 Asn Ala Lys Val Leu Ile Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr 370 375 380 Ile Val Val Gly Arg Gly Glu Gln Gln Ile Asn His His Trp His Lys 385 390 395 400 Ser Gly Ser Ser Ile Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly Ala 405 410 415 Gln Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp 420 425 <210> 493 <211> 1506 <212> DNA <213> Flavivirus Japanese Encephalitis Virus <400> 493 atgttcaact gtctgggaat gggcaatcgt gacttcatag aaggagccag tggagccact 60 tgggtggact tggtgctaga aggagatagc tgcttgacaa tcatggcaaa cgacaaacca 120 acattggacg tccgcatgat taacatcgaa gctagtcaac ttgctgaggt cagaagttac 180 tgctatcatg cttcagtcac tgacatctcg acggtggctc ggtgccccac gactggagaa 240 gcccacaacg agaagcgagc tgatagtagc tatgtgtgca aacaaggctt cactgatcgt 300 gggtggggca acggatgtgg actcttcggg aaggggagca ttgacacatg tgcaaaattc 360 tcctgcacta gcaaagcgat tgggagaaca atccagccag aaaacatcaa atacgaagtt 420 ggcatttttg tgcatggaac caccacttca gaaaaccatg ggaattattc agcgcaagtt 480 ggggcttccc aggcggcaaa gtttacagta acacccaatg ctccttcgat aaccctcaaa 540 cttggtgact acggagaagt cacgctggac tgtgagccaa ggagtggact gaacactgaa 600 gcgttttacg tcatgaccgt ggggtcaaag tcatttctgg tccataggga atggtttcat 660 gacctcgctc tcccctggac gtctccttcg agcacagcgt ggagaaacag agaactcctc 720 atggaatttg aagaagcgca cgccacaaaa cagtccgttg ttgctcttgg gtcacaggaa 780 ggaggcctcc atcaggcgct ggcaggggcc attgtggtgg agtactcaag ctcagtaaag 840 ctaacatcag gccacctgaa atgcaggcta aaaatggaca aactggccct gaaaggcaca 900 acctatggca tgtgtacagg aaaattctcg ttcgcgaaaa atccggcgga cactggccac 960 ggaacagttg tcattgaact ctcctactct gggagagacg gcccctgcaa aattccgatt 1020 gtctccgttg cgagccttaa tgacatgact cccgttgggc ggctggtgac agtgaaccct 1080 ttcgtcgcga cttccagtgc taactcaaag gtgctggtcg agatggaacc ccctttcgga 1140 gactcctaca tcgtggttgg gaggggagac aagcagatta accaccattg gcacaaagct 1200 ggaagcacgc taggcaaggc cttttcaaca actttgaagg gggctcaaag gctggcagcg 1260 ttgggcgaca cagcctggga ctttggctct attggagggg tcttcaactc cataggaaaa 1320 gccgtccacc aagtgtttgg tggtgccttc agaacactct tcgggggaat gtcttggatc 1380 acacaagggc taatgggtgc cctactgctt tggatgggcg tcaacgcacg agaccgatca 1440 attgctctgg ccttcttagc cacaggaggt gtgctcgtgt tcttagcgac caatgtgcat 1500 gcttag 1506 <210> 494 <211> 501 <212> PRT <213> Flavivirus Japanese Encephalitis Virus <400> 494 Met Phe Asn Cys Leu Gly Met Gly Asn Arg Asp Phe Ile Glu Gly Ala 1 5 10 15 Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Leu 20 25 30 Thr Ile Met Ala Asn Asp Lys Pro Thr Leu Asp Val Arg Met Ile Asn 35 40 45 Ile Glu Ala Ser Gln Leu Ala Glu Val Arg Ser Tyr Cys Tyr His Ala 50 55 60 Ser Val Thr Asp Ile Ser Thr Val Ala Arg Cys Pro Thr Thr Gly Glu 65 70 75 80 Ala His Asn Glu Lys Arg Ala Asp Ser Ser Tyr Val Cys Lys Gln Gly 85 90 95 Phe Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly 100 105 110 Ser Ile Asp Thr Cys Ala Lys Phe Ser Cys Thr Ser Lys Ala Ile Gly 115 120 125 Arg Thr Ile Gln Pro Glu Asn Ile Lys Tyr Glu Val Gly Ile Phe Val 130 135 140 His Gly Thr Thr Thr Ser Glu Asn His Gly Asn Tyr Ser Ala Gln Val 145 150 155 160 Gly Ala Ser Gln Ala Ala Lys Phe Thr Val Thr Pro Asn Ala Pro Ser 165 170 175 Ile Thr Leu Lys Leu Gly Asp Tyr Gly Glu Val Thr Leu Asp Cys Glu 180 185 190 Pro Arg Ser Gly Leu Asn Thr Glu Ala Phe Tyr Val Met Thr Val Gly 195 200 205 Ser Lys Ser Phe Leu Val His Arg Glu Trp Phe His Asp Leu Ala Leu 210 215 220 Pro Trp Thr Ser Pro Ser Ser Thr Ala Trp Arg Asn Arg Glu Leu Leu 225 230 235 240 Met Glu Phe Glu Glu Ala His Ala Thr Lys Gln Ser Val Val Ala Leu 245 250 255 Gly Ser Gln Glu Gly Gly Leu His Gln Ala Leu Ala Gly Ala Ile Val 260 265 270 Val Glu Tyr Ser Ser Ser Val Lys Leu Thr Ser Gly His Leu Lys Cys 275 280 285 Arg Leu Lys Met Asp Lys Leu Ala Leu Lys Gly Thr Thr Tyr Gly Met 290 295 300 Cys Thr Gly Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His 305 310 315 320 Gly Thr Val Val Ile Glu Leu Ser Tyr Ser Gly Arg Asp Gly Pro Cys 325 330 335 Lys Ile Pro Ile Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val 340 345 350 Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ala Asn 355 360 365 Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile 370 375 380 Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala 385 390 395 400 Gly Ser Thr Leu Gly Lys Ala Phe Ser Thr Thr Leu Lys Gly Ala Gln 405 410 415 Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly 420 425 430 Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly 435 440 445 Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu 450 455 460 Met Gly Ala Leu Leu Leu Trp Met Gly Val Asn Ala Arg Asp Arg Ser 465 470 475 480 Ile Ala Leu Ala Phe Leu Ala Thr Gly Gly Val Leu Val Phe Leu Ala 485 490 495 Thr Asn Val His Ala 500 <210> 495 <211> 2179 <212> DNA <213> Pegivirus Hepatitis G Virus <400> 495 gcaaagcacg tgagatcgcc accatgtcac ttctcacgaa ccgctttatt cggcgagtag 60 ataaagacca atggggccca ggtgtgatgg gtaaagatcc caaaccttgt cctagccgct 120 gggcaggaaa gtgtatgggc ccaccaagct ccgccgcagc atgtagtcgc ggcagcccgc 180 gtatacttcg tgttcgggcg ggtggtattt ccttgttcta tacgataatg gctgtgctcc 240 tgctgctcct tgttgtcgaa gcgggtgcta tactggcccc agctacccat gcatgccgcg 300 cgaatggaca gtattttctg acaaattgct gtgcaccgga agacataggg ttttgtctcg 360 aaggtggctg tctcgtcgct ttgggctgca cagtttgtac tgatcggtgt tggccgctgt 420 atcaagcagg ccttgctgtg cgccctggga aaagcgctgc acagctggtt ggagagttgg 480 ggagcctgta cggccccctt tctgtctctg cctacgtggc gggcatattg ggtctgggtg 540 aggtctattc tggagttttg acggtcggtg ttgccctcag gcgaagagtc tatctgatgc 600 ctaatctcaa atgtgcagtg gaatgcgatg tcaagtgggg aagcgagttc tggagatgga 660 cggagcaact ggccagcaac tactggattc ttgaatatct gtggaaagtc cctttcgaat 720 tttggagagg cgtaatgtcc cttacacccc tgctcgtgtg ggtggccgcg ttgctccttc 780 tggagcaacg gatcgtgatg gttttccttc tggttacaat ggcagggatg ctccaaggtg 840 caccagcatc agtgctcgga tcaagacctt tcgactacgg gctgaaatgg cagtcctgta 900 gttgccgagc aaatggctcc aggatcccaa ctggtgaaag ggtatgggac cggggtaacg 960 tgacactgct gtgcgattgc ccaaatggac cgtgggtgtg ggtccccgcc ttttgtcagg 1020 cagtaggctg gggagatcca ataactcatt ggtcccacgg gcaaaaccaa tggcctttgt 1080 cctgtccgca atatgtatat ggctcagtgt cagtgacttg tgtttggggc tcagtctcct 1140 ggttcgcttc cacgggcggc agagattcca aaatagatgt ctggtctctt gtaccagtgg 1200 gctcagcctc atgcaccata gctgccttgg ggagctcaga tagggacact gtcgtggaac 1260 tctccgaatg gggtgtcccc tgtgtcacat gcattttgga tagaagacca gcttcatgtg 1320 gaacatgcgt tagggattgt tggcccgaaa ccggatccgt gcgttttccg ttccaccgct 1380 gcggaaccgg acctagactc actaaagatc tggaagccgt ccctttcgtt aataggacca 1440 ctcccttcac cattcgagga cctctgggta atcaaggccg gggaaacccc gtgcggagcc 1500 cacttggatt tggcagctac acaatgacga aaattcggga ctcattgcat cttgtgaaat 1560 gtccaacacc tgctattgag cccccgactg gcacctttgg attctttcct ggtgtgccac 1620 ccataaataa ttgcatgccg ctggggacgg aagtgagtga agcccttggc ggggcaggcc 1680 tgacgggtgg cttttatgaa ccactggtac gcagatgttc tgaactcatg ggacggcgga 1740 acccagtgtg ccctggctac gcatggctta gcagtggtcg gccagacggg ttcattcatg 1800 ttcaaggcca tttgcaggaa gtggacgccg gcaatttcat cccaccccct cgctggctgc 1860 tcctggactt tgtgtttgtg ctcctgtatc tgatgaagct ggcagaggcg aggttggtcc 1920 cactgatatt gctcctgctt tggtggtggg tcaatcagtt ggccgtgctc ggactgcccg 1980 cagtagacgc cgccgtggcc ggagaagttt tcgcaggccc cgccttgagt tggtgtctcg 2040 gattgcctac agtgagcatg atcctcggtc tcgcgaacct ggtgctttac ttccgctgga 2100 tggggccaca gaggttgatg tttctggttc tgtggaaatt ggctaggggt ttataagatc 2160 tgaattcacc ccaccagtg 2179 <210> 496 <211> 710 <212> PRT <213> Pegivirus Hepatitis G Virus <400> 496 Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln 1 5 10 15 Trp Gly Pro Gly Val Met Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg 20 25 30 Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser 35 40 45 Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu 50 55 60 Phe Tyr Thr Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala 65 70 75 80 Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln 85 90 95 Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu 100 105 110 Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Val Cys Thr Asp Arg 115 120 125 Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser 130 135 140 Ala Ala Gln Leu Val Gly Glu Leu Gly Ser Leu Tyr Gly Pro Leu Ser 145 150 155 160 Val Ser Ala Tyr Val Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser 165 170 175 Gly Val Leu Thr Val Gly Val Ala Leu Arg Arg Arg Val Tyr Leu Met 180 185 190 Pro Asn Leu Lys Cys Ala Val Glu Cys Asp Val Lys Trp Gly Ser Glu 195 200 205 Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu 210 215 220 Tyr Leu Trp Lys Val Pro Phe Glu Phe Trp Arg Gly Val Met Ser Leu 225 230 235 240 Thr Pro Leu Leu Val Trp Val Ala Ala Leu Leu Leu Leu Glu Gln Arg 245 250 255 Ile Val Met Val Phe Leu Leu Val Thr Met Ala Gly Met Leu Gln Gly 260 265 270 Ala Pro Ala Ser Val Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Lys 275 280 285 Trp Gln Ser Cys Ser Cys Arg Ala Asn Gly Ser Arg Ile Pro Thr Gly 290 295 300 Glu Arg Val Trp Asp Arg Gly Asn Val Thr Leu Leu Cys Asp Cys Pro 305 310 315 320 Asn Gly Pro Trp Val Trp Val Pro Ala Phe Cys Gln Ala Val Gly Trp 325 330 335 Gly Asp Pro Ile Thr His Trp Ser His Gly Gln Asn Gln Trp Pro Leu 340 345 350 Ser Cys Pro Gln Tyr Val Tyr Gly Ser Val Ser Val Thr Cys Val Trp 355 360 365 Gly Ser Val Ser Trp Phe Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile 370 375 380 Asp Val Trp Ser Leu Val Pro Val Gly Ser Ala Ser Cys Thr Ile Ala 385 390 395 400 Ala Leu Gly Ser Ser Asp Arg Asp Thr Val Val Glu Leu Ser Glu Trp 405 410 415 Gly Val Pro Cys Val Thr Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys 420 425 430 Gly Thr Cys Val Arg Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe 435 440 445 Pro Phe His Arg Cys Gly Thr Gly Pro Arg Leu Thr Lys Asp Leu Glu 450 455 460 Ala Val Pro Phe Val Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro 465 470 475 480 Leu Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe 485 490 495 Gly Ser Tyr Thr Met Thr Lys Ile Arg Asp Ser Leu His Leu Val Lys 500 505 510 Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe 515 520 525 Pro Gly Val Pro Pro Ile Asn Asn Cys Met Pro Leu Gly Thr Glu Val 530 535 540 Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro 545 550 555 560 Leu Val Arg Arg Cys Ser Glu Leu Met Gly Arg Arg Asn Pro Val Cys 565 570 575 Pro Gly Tyr Ala Trp Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His 580 585 590 Val Gln Gly His Leu Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro 595 600 605 Pro Arg Trp Leu Leu Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met 610 615 620 Lys Leu Ala Glu Ala Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp 625 630 635 640 Trp Trp Val Asn Gln Leu Ala Val Leu Gly Leu Pro Ala Val Asp Ala 645 650 655 Ala Val Ala Gly Glu Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu 660 665 670 Gly Leu Pro Thr Val Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu 675 680 685 Tyr Phe Arg Trp Met Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp 690 695 700 Lys Leu Ala Arg Gly Leu 705 710 <210> 497 <211> 1666 <212> DNA <213> Rubulavirus Mumps Virus F <400> 497 gcaaagcacg tgagatcgcc accatgaaag tcttcctcgt gacctgtctt ggcttcgccg 60 tgttcagcag ttctgtgtgt gtgaatatca acatactgca gcagatcggc tatatcaaac 120 aacaagtgag gcagctctcc tattactctc agagtagcag ctcttacatt gtcgttaagc 180 tgctccccaa tattcaacca acagacaata gttgtgagtt taagtcagta acgcaatata 240 acaaaactct gtctaacctc ttgctcccta tagccgagaa cattaataac attgcatcac 300 catcatctgg aagcagaagg cataaacgct tcgctgggat tgccataggc attgcggccc 360 tcggcgtggc gacagctgcc caagtaaccg cggctgtcag cctcgttcaa gcccagacca 420 atgccagagc tatcgctgcg atgaagaata gcatccaggc cactaaccga gcagtcttcg 480 aagttaagga aggcacacag cggcttgcca tcgcggtaca agccattcaa gatcatatta 540 acacaattat gaatactcaa ctgaataaca tgtcatgtca gatccttgat aaccaactgg 600 ctacatctct gggcttgtac ctgaccgagc tgaccactgt ctttcagccc caactgatca 660 accctgccct gtcacctatc agcattcaag cactcaggtc acttcttggg tccatgactc 720 ccgctgtcgt gcaagctaca ctctcaacat ccatctctgc agccgaaatt ctgtccgctg 780 gcctcatgga aggccaaatt gtgagcgttc tcctcgatga gatgcagatg atagtcaaaa 840 ttaacattcc taccatagtg acgcaatcaa acgcactcgt aatcgacttt tacagtatct 900 ctagcttcat taataaccaa gaatctatca tccaattgcc agatcggatc cttgaaatcg 960 gaaatgaaca gtggagttat cctgcgaaga actgtaaatt gacgagacac cacatcttct 1020 gtcaatacaa tgaggccgaa agactcagcc tcgaatctaa actctgcttg gcaggcaata 1080 tcagcgcctg tgtattcagc cctatcgcag ggtcttatat gcggcgcttt gtagcactcg 1140 acggaacaat agtcgctaac tgccgatcat tgacctgtct gtgcaagagc cccagctacc 1200 ctatttatca acccgaccac catgctgtta ctacgattga cctcactgcg tgccagacct 1260 tgagcctcga tgggctcgat tttagtatag tctctctgag taatataaca tatgctgaaa 1320 acttgacaat cagcctgagt cagactatca acactcagcc cattgatatt tccacggaac 1380 ttagtaaagt aaacgccagc ctgcaaaacg cagttaaata tataaaggaa tccaatcatc 1440 aactccaaag cgtaaacgtt aatagcaaaa taggcgccat cattgtggct gcactggtcc 1500 tctcaatcct gtcaatcatt atcagccttt tgttctgttg ctgggcttac gtagccacta 1560 aagagatcag gcggatcaac ttcaaaacga accacattaa cacaatttca tctagcgtcg 1620 atgatctcat ccggtactta taagatctga attcacccca ccagtg 1666 <210> 498 <211> 539 <212> PRT <213> Rubulavirus Mumps Virus F <400> 498 Met Lys Val Phe Leu Val Thr Cys Leu Gly Phe Ala Val Phe Ser Ser 1 5 10 15 Ser Val Cys Val Asn Ile Asn Ile Leu Gln Gln Ile Gly Tyr Ile Lys 20 25 30 Gln Gln Val Arg Gln Leu Ser Tyr Tyr Ser Gln Ser Ser Ser Ser Tyr 35 40 45 Ile Val Val Lys Leu Leu Pro Asn Ile Gln Pro Thr Asp Asn Ser Cys 50 55 60 Glu Phe Lys Ser Val Thr Gln Tyr Asn Lys Thr Leu Ser Asn Leu Leu 65 70 75 80 Leu Pro Ile Ala Glu Asn Ile Asn Asn Ile Ala Ser Pro Ser Ser Gly 85 90 95 Ser Arg Arg His Lys Arg Phe Ala Gly Ile Ala Ile Gly Ile Ala Ala 100 105 110 Leu Gly Val Ala Thr Ala Ala Gln Val Thr Ala Ala Val Ser Leu Val 115 120 125 Gln Ala Gln Thr Asn Ala Arg Ala Ile Ala Ala Met Lys Asn Ser Ile 130 135 140 Gln Ala Thr Asn Arg Ala Val Phe Glu Val Lys Glu Gly Thr Gln Arg 145 150 155 160 Leu Ala Ile Ala Val Gln Ala Ile Gln Asp His Ile Asn Thr Ile Met 165 170 175 Asn Thr Gln Leu Asn Asn Met Ser Cys Gln Ile Leu Asp Asn Gln Leu 180 185 190 Ala Thr Ser Leu Gly Leu Tyr Leu Thr Glu Leu Thr Thr Val Phe Gln 195 200 205 Pro Gln Leu Ile Asn Pro Ala Leu Ser Pro Ile Ser Ile Gln Ala Leu 210 215 220 Arg Ser Leu Leu Gly Ser Met Thr Pro Ala Val Val Gln Ala Thr Leu 225 230 235 240 Ser Thr Ser Ile Ser Ala Ala Glu Ile Leu Ser Ala Gly Leu Met Glu 245 250 255 Gly Gln Ile Val Ser Val Leu Leu Asp Glu Met Gln Met Ile Val Lys 260 265 270 Ile Asn Ile Pro Thr Ile Val Thr Gln Ser Asn Ala Leu Val Ile Asp 275 280 285 Phe Tyr Ser Ile Ser Ser Phe Ile Asn Asn Gln Glu Ser Ile Ile Gln 290 295 300 Leu Pro Asp Arg Ile Leu Glu Ile Gly Asn Glu Gln Trp Ser Tyr Pro 305 310 315 320 Ala Lys Asn Cys Lys Leu Thr Arg His His Ile Phe Cys Gln Tyr Asn 325 330 335 Glu Ala Glu Arg Leu Ser Leu Glu Ser Lys Leu Cys Leu Ala Gly Asn 340 345 350 Ile Ser Ala Cys Val Phe Ser Pro Ile Ala Gly Ser Tyr Met Arg Arg 355 360 365 Phe Val Ala Leu Asp Gly Thr Ile Val Ala Asn Cys Arg Ser Leu Thr 370 375 380 Cys Leu Cys Lys Ser Pro Ser Tyr Pro Ile Tyr Gln Pro Asp His His 385 390 395 400 Ala Val Thr Thr Ile Asp Leu Thr Ala Cys Gln Thr Leu Ser Leu Asp 405 410 415 Gly Leu Asp Phe Ser Ile Val Ser Leu Ser Asn Ile Thr Tyr Ala Glu 420 425 430 Asn Leu Thr Ile Ser Leu Ser Gln Thr Ile Asn Thr Gln Pro Ile Asp 435 440 445 Ile Ser Thr Glu Leu Ser Lys Val Asn Ala Ser Leu Gln Asn Ala Val 450 455 460 Lys Tyr Ile Lys Glu Ser Asn His Gln Leu Gln Ser Val Asn Val Asn 465 470 475 480 Ser Lys Ile Gly Ala Ile Ile Val Ala Ala Leu Val Leu Ser Ile Leu 485 490 495 Ser Ile Ile Ile Ser Leu Leu Phe Cys Cys Trp Ala Tyr Val Ala Thr 500 505 510 Lys Glu Ile Arg Arg Ile Asn Phe Lys Thr Asn His Ile Asn Thr Ile 515 520 525 Ser Ser Ser Val Asp Asp Leu Ile Arg Tyr Leu 530 535 <210> 499 <211> 1798 <212> DNA <213> Rubulavirus Mumps Virus HN <400> 499 gcaaagcacg tgagatcgcc accatggaac ctagtaagct tttcaccatg tccgataatg 60 ctacattcgc accaggcccc gtcattaacg cagccgacaa gaaaacattc cgtacatgtt 120 tccgcattct ggtcctgtca gtccaggcag tcactcttat tctggtaatt gttactctgg 180 gcgaactcgt tcgcatgatt aacgaccagg gactgtctaa ccagctctcc tctattgccg 240 ataagatcag agagtccgcc accatgatcg catcagcagt cggagtgatg aatcaagtga 300 ttcatggggt gacagtttca ctgccactcc aaatagaagg aaatcaaaat cagcttctct 360 caactcttgc cacgatttgc acaggaaaga agcaggtttc taactgttct actaacatac 420 cattggtgaa tgatctgcgg tttattaatg ggatcaataa gttcatcatt gaagactatg 480 ctacgcatga cttcagcatt ggccacccgc tgaatatgcc tagttttatc ccaacagcca 540 caagccccaa tggttgcacc cggattccgt cctttagctt ggggaaaacc cattggtgct 600 atacccacaa tgttattaac gctaattgca aagatcatac atcttccaat caatacatta 660 gcatgggcat ccttgtacaa acggcctcag gctatcccat gtttaaaact ctgaaaatac 720 aatatctgag cgatggcctg aacaggaaga gttgctctat cgcaaccgtg cctgatgggt 780 gcgcaatgta ctgttatgtg agtacccaac ttgaaaccga tgactatgca ggctcttctc 840 cccctaccca gaaactgaca ctgctgttct ataacgatac tgttacggag cgtaccataa 900 gccccactgg acttgaaggt aattgggcta cccttgtgcc tggagtagga tccggtatct 960 actttgagaa taagctcata ttccctgcgt atggcggggt gctgcccaac agttctctcg 1020 gcgtcaagag tgcacgcgag ttcttcagac cagtgaaccc ctataatccc tgctcagggc 1080 cccaacaaga cttggatcag cgcgcactta gatcctattt tccttcctat tttagtaatc 1140 gtcgagtcca gagcgctttc ctcgtgtgtg cttggaatca gattttggta acaaactgtg 1200 aactggtcgt cccatccaat aatcaaaccc ttatgggagc agaagggcgg gtcctgctta 1260 ttaacaaccg actgctctac taccaaagaa gcacaagttg gtggccatac gaacttctct 1320 atgaaatttc cttcacattc accaacagtg gtcagagctc agtgaatatg agttggatac 1380 ccatatatag ctttacacga cctggatcag gcaactgtag cggggaaaat gtttgtccta 1440 cagcatgtgt aagtggcgtt tatctggatc cgtggccgct taccccatac tcccatcaat 1500 ccggtattaa ccgaaatttc tatttcactg gcgcactctt gaacagtagt acgacaagag 1560 taaaccccac cctgtacgtt tcagctttga acaatcttaa ggtgctggct ccatatggaa 1620 atcagggtct gtttgcttcc tacactacta caacatgttt ccaagatacc ggagatgcct 1680 ctgtatattg tgtgtatatc atggaactgg cgtcaaacat cgtcggcgaa tttcaaatat 1740 tgcccgtcct gactcggctg acaataacct tataagatct gaattcaccc caccagtg 1798 <210> 500 <211> 583 <212> PRT <213> Rubulavirus Mumps Virus HN <400> 500 Met Glu Pro Ser Lys Leu Phe Thr Met Ser Asp Asn Ala Thr Phe Ala 1 5 10 15 Pro Gly Pro Val Ile Asn Ala Ala Asp Lys Lys Thr Phe Arg Thr Cys 20 25 30 Phe Arg Ile Leu Val Leu Ser Val Gln Ala Val Thr Leu Ile Leu Val 35 40 45 Ile Val Thr Leu Gly Glu Leu Val Arg Met Ile Asn Asp Gln Gly Leu 50 55 60 Ser Asn Gln Leu Ser Ser Ile Ala Asp Lys Ile Arg Glu Ser Ala Thr 65 70 75 80 Met Ile Ala Ser Ala Val Gly Val Met Asn Gln Val Ile His Gly Val 85 90 95 Thr Val Ser Leu Pro Leu Gln Ile Glu Gly Asn Gln Asn Gln Leu Leu 100 105 110 Ser Thr Leu Ala Thr Ile Cys Thr Gly Lys Lys Gln Val Ser Asn Cys 115 120 125 Ser Thr Asn Ile Pro Leu Val Asn Asp Leu Arg Phe Ile Asn Gly Ile 130 135 140 Asn Lys Phe Ile Ile Glu Asp Tyr Ala Thr His Asp Phe Ser Ile Gly 145 150 155 160 His Pro Leu Asn Met Pro Ser Phe Ile Pro Thr Ala Thr Ser Pro Asn 165 170 175 Gly Cys Thr Arg Ile Pro Ser Phe Ser Leu Gly Lys Thr His Trp Cys 180 185 190 Tyr Thr His Asn Val Ile Asn Ala Asn Cys Lys Asp His Thr Ser Ser 195 200 205 Asn Gln Tyr Ile Ser Met Gly Ile Leu Val Gln Thr Ala Ser Gly Tyr 210 215 220 Pro Met Phe Lys Thr Leu Lys Ile Gln Tyr Leu Ser Asp Gly Leu Asn 225 230 235 240 Arg Lys Ser Cys Ser Ile Ala Thr Val Pro Asp Gly Cys Ala Met Tyr 245 250 255 Cys Tyr Val Ser Thr Gln Leu Glu Thr Asp Asp Tyr Ala Gly Ser Ser 260 265 270 Pro Pro Thr Gln Lys Leu Thr Leu Leu Phe Tyr Asn Asp Thr Val Thr 275 280 285 Glu Arg Thr Ile Ser Pro Thr Gly Leu Glu Gly Asn Trp Ala Thr Leu 290 295 300 Val Pro Gly Val Gly Ser Gly Ile Tyr Phe Glu Asn Lys Leu Ile Phe 305 310 315 320 Pro Ala Tyr Gly Gly Val Leu Pro Asn Ser Ser Leu Gly Val Lys Ser 325 330 335 Ala Arg Glu Phe Phe Arg Pro Val Asn Pro Tyr Asn Pro Cys Ser Gly 340 345 350 Pro Gln Gln Asp Leu Asp Gln Arg Ala Leu Arg Ser Tyr Phe Pro Ser 355 360 365 Tyr Phe Ser Asn Arg Arg Val Gln Ser Ala Phe Leu Val Cys Ala Trp 370 375 380 Asn Gln Ile Leu Val Thr Asn Cys Glu Leu Val Val Pro Ser Asn Asn 385 390 395 400 Gln Thr Leu Met Gly Ala Glu Gly Arg Val Leu Leu Ile Asn Asn Arg 405 410 415 Leu Leu Tyr Tyr Gln Arg Ser Thr Ser Trp Trp Pro Tyr Glu Leu Leu 420 425 430 Tyr Glu Ile Ser Phe Thr Phe Thr Asn Ser Gly Gln Ser Ser Val Asn 435 440 445 Met Ser Trp Ile Pro Ile Tyr Ser Phe Thr Arg Pro Gly Ser Gly Asn 450 455 460 Cys Ser Gly Glu Asn Val Cys Pro Thr Ala Cys Val Ser Gly Val Tyr 465 470 475 480 Leu Asp Pro Trp Pro Leu Thr Pro Tyr Ser His Gln Ser Gly Ile Asn 485 490 495 Arg Asn Phe Tyr Phe Thr Gly Ala Leu Leu Asn Ser Ser Thr Thr Arg 500 505 510 Val Asn Pro Thr Leu Tyr Val Ser Ala Leu Asn Asn Leu Lys Val Leu 515 520 525 Ala Pro Tyr Gly Asn Gln Gly Leu Phe Ala Ser Tyr Thr Thr Thr Thr 530 535 540 Cys Phe Gln Asp Thr Gly Asp Ala Ser Val Tyr Cys Val Tyr Ile Met 545 550 555 560 Glu Leu Ala Ser Asn Ile Val Gly Glu Phe Gln Ile Leu Pro Val Leu 565 570 575 Thr Arg Leu Thr Ile Thr Leu 580 <210> 501 <211> 1747 <212> DNA <213> Respirovirus Sendai Virus F <400> 501 gcaaagcacg tgagatcgcc accatgactg catacattca aagaagccaa tgcattagca 60 caagtctcct tgtggtgctg acgaccctcg tttcctgtca gatcccgcgt gatcgacttt 120 ccaatatcgg ggttattgtc gacgagggca agtccttgaa aatcgcaggt tcccacgagt 180 ctaggtacat cgtgctgtca ctggttcccg gcgtcgactt tgagaatggt tgcggtacag 240 cccaagtaat tcagtacaag agcctgctca acaggcttct gatccctctc cgagatgcct 300 tggatctgca agaagctctg attactgtga cgaacgacac gactcaaaat gccggggctc 360 cacagtctcg cttcttcggc gcagtgatcg gcacgatcgc tctgggcgtt gccacttccg 420 ctcagatcac cgctggtatt gcccttgctg aagctcggga agccaaacgt gatattgcgc 480 tgataaagga gagcatgaca aagactcata agtcaatcga actgcttcag aacgccgtgg 540 gagagcaaat tcttgctctc aaaaccctgc aggacttcgt gaatgatgag attaaaccag 600 ccatcagtga actgggttgc gagactgctg ctctgcgtct gggaattaaa ctgacccaac 660 attactccga gctcctcact gctttcggct ctaactttgg aacgattgga gagaaaagcc 720 tgacccttca ggctctctct tctctctact ccgccaacat cacagagatt atgacgacga 780 tcaaaacggg gcaatccaac atttatgatg tcatttatac tgagcagatc aaaggtaccg 840 tgatcgatgt tgacctggaa aggtacatgg tgacactctc agtcaaaatc cccatcctca 900 gtgaggtgcc aggcgtattg attcataaag caagcagcat tagctataac atagatgggg 960 aagagtggta cgttaccgtc cccagtcata tactgtctag agccagtttc ctcggtggtg 1020 cagatataac cgactgtgtg gagagccggc tgacctatat ttgtccgcgc gatcccgcac 1080 aattgattcc agacagccag caaaagtgca tcctcgggga caccacacga tgtcctgtta 1140 cgaaggtagt cgactcactg atccccaagt tcgccttcgt caacggtggc gtagttgcca 1200 attgcattgc cagcacttgt acatgtggca caggacgcag acctattagc caagatcgtt 1260 caaagggcgt ggttttcctc acacacgata attgcggact gataggggtg aacggtgttg 1320 aactttacgc taaccgcaga ggacacgatg caacatgggg cgtacagaat ttgacagtcg 1380 ggcctgcaat tgcaatacgt cctatcgaca tctctctcaa cctggcggac gctaccaatt 1440 ttctgcaaga ctccaaggct gaacttgaga aagcgaggaa gattctgtcc gaagtcggcc 1500 gatggtataa ctctcgggaa actgtcatta ccatcattgt cgtgatggtt gtcattttgg 1560 tggtgatcat tgtgataatt attgtcctct ataggctgag gagatctatg ctgatgggta 1620 acccggatga cagaatccca cgcgacacgt acacccttga gccgaaaatt cggcatatgt 1680 atacgaatgg tggatttgat gcaatggcgg aaaagcgctt ataagatctg aattcacccc 1740 accagtg 1747 <210> 502 <211> 566 <212> PRT <213> Respirovirus Sendai Virus F <400> 502 Met Thr Ala Tyr Ile Gln Arg Ser Gln Cys Ile Ser Thr Ser Leu Leu 1 5 10 15 Val Val Leu Thr Thr Leu Val Ser Cys Gln Ile Pro Arg Asp Arg Leu 20 25 30 Ser Asn Ile Gly Val Ile Val Asp Glu Gly Lys Ser Leu Lys Ile Ala 35 40 45 Gly Ser His Glu Ser Arg Tyr Ile Val Leu Ser Leu Val Pro Gly Val 50 55 60 Asp Phe Glu Asn Gly Cys Gly Thr Ala Gln Val Ile Gln Tyr Lys Ser 65 70 75 80 Leu Leu Asn Arg Leu Leu Ile Pro Leu Arg Asp Ala Leu Asp Leu Gln 85 90 95 Glu Ala Leu Ile Thr Val Thr Asn Asp Thr Thr Gln Asn Ala Gly Ala 100 105 110 Pro Gln Ser Arg Phe Phe Gly Ala Val Ile Gly Thr Ile Ala Leu Gly 115 120 125 Val Ala Thr Ser Ala Gln Ile Thr Ala Gly Ile Ala Leu Ala Glu Ala 130 135 140 Arg Glu Ala Lys Arg Asp Ile Ala Leu Ile Lys Glu Ser Met Thr Lys 145 150 155 160 Thr His Lys Ser Ile Glu Leu Leu Gln Asn Ala Val Gly Glu Gln Ile 165 170 175 Leu Ala Leu Lys Thr Leu Gln Asp Phe Val Asn Asp Glu Ile Lys Pro 180 185 190 Ala Ile Ser Glu Leu Gly Cys Glu Thr Ala Ala Leu Arg Leu Gly Ile 195 200 205 Lys Leu Thr Gln His Tyr Ser Glu Leu Leu Thr Ala Phe Gly Ser Asn 210 215 220 Phe Gly Thr Ile Gly Glu Lys Ser Leu Thr Leu Gln Ala Leu Ser Ser 225 230 235 240 Leu Tyr Ser Ala Asn Ile Thr Glu Ile Met Thr Thr Ile Lys Thr Gly 245 250 255 Gln Ser Asn Ile Tyr Asp Val Ile Tyr Thr Glu Gln Ile Lys Gly Thr 260 265 270 Val Ile Asp Val Asp Leu Glu Arg Tyr Met Val Thr Leu Ser Val Lys 275 280 285 Ile Pro Ile Leu Ser Glu Val Pro Gly Val Leu Ile His Lys Ala Ser 290 295 300 Ser Ile Ser Tyr Asn Ile Asp Gly Glu Glu Trp Tyr Val Thr Val Pro 305 310 315 320 Ser His Ile Leu Ser Arg Ala Ser Phe Leu Gly Gly Ala Asp Ile Thr 325 330 335 Asp Cys Val Glu Ser Arg Leu Thr Tyr Ile Cys Pro Arg Asp Pro Ala 340 345 350 Gln Leu Ile Pro Asp Ser Gln Gln Lys Cys Ile Leu Gly Asp Thr Thr 355 360 365 Arg Cys Pro Val Thr Lys Val Val Asp Ser Leu Ile Pro Lys Phe Ala 370 375 380 Phe Val Asn Gly Gly Val Val Ala Asn Cys Ile Ala Ser Thr Cys Thr 385 390 395 400 Cys Gly Thr Gly Arg Arg Pro Ile Ser Gln Asp Arg Ser Lys Gly Val 405 410 415 Val Phe Leu Thr His Asp Asn Cys Gly Leu Ile Gly Val Asn Gly Val 420 425 430 Glu Leu Tyr Ala Asn Arg Arg Gly His Asp Ala Thr Trp Gly Val Gln 435 440 445 Asn Leu Thr Val Gly Pro Ala Ile Ala Ile Arg Pro Ile Asp Ile Ser 450 455 460 Leu Asn Leu Ala Asp Ala Thr Asn Phe Leu Gln Asp Ser Lys Ala Glu 465 470 475 480 Leu Glu Lys Ala Arg Lys Ile Leu Ser Glu Val Gly Arg Trp Tyr Asn 485 490 495 Ser Arg Glu Thr Val Ile Thr Ile Ile Val Val Met Val Val Ile Leu 500 505 510 Val Val Ile Ile Val Ile Ile Ile Val Leu Tyr Arg Leu Arg Arg Ser 515 520 525 Met Leu Met Gly Asn Pro Asp Asp Arg Ile Pro Arg Asp Thr Tyr Thr 530 535 540 Leu Glu Pro Lys Ile Arg His Met Tyr Thr Asn Gly Gly Phe Asp Ala 545 550 555 560 Met Ala Glu Lys Arg Leu 565 <210> 503 <211> 1777 <212> DNA <213> Respirovirus Sendai Virus HN <400> 503 gcaaagcacg tgagatcgcc accatggatg gcgaccgagg caaacgcgac tcttattgga 60 gcacttcccc tagtgggtcc accactaagc cggctagcgg atgggagaga tcaagtaagg 120 ccgatacgtg gctcttgatc ttgagcttca cccaatgggc tttgagtatt gctactgtta 180 ttatttgcat catcatctca gctcggcaag gatactctat gaaagagtac agcatgacgg 240 tggaagcatt gaatatgtct tctcgggaag tgaaggaatc actcacatct ttgattaggc 300 aggaagtcat agcccgggct gtgaatatcc aatccagcgt ccaaacaggg atcccggtgc 360 tcctgaacaa gaactcccga gacgtcatcc aaatgatcga taaatcttgt tcacgccaag 420 aacttaccca acattgtgaa agcactattg ccgtccatca cgcagacggc attgcacccc 480 tggagccgca ctcattctgg cgttgcccgg ttggtgaacc ctatctgtca tctgaccccg 540 agatcagtct gctccctgga ccttcactcc tctccggttc caccacgata agcgggtgtg 600 tcaggttgcc atccctctcc atcggggaag cgatttatgc gtatagcagc aacttgatta 660 cgcaaggctg tgctgacatc ggtaagtcct accaggtgct tcagcttggt tatatcagcc 720 ttaattctga tatgtttccg gacctcaatc ctgtggtctc acatacatat gacatcaatg 780 acaacagaaa atcctgtagc gtagtcgcaa cagggacgag agggtatcaa ctctgttcta 840 tgcctacagt cgacgagaga actgattata gctcagacgg aatcgaagat ctcgtcctgg 900 acgttctcga tttgaaaggt cgcacaaaat cacaccgcta cagaaattcc gaggtggacc 960 tcgatcatcc tttctccgcg ttgtatccta gtgtgggcaa cggcattgct actgaaggct 1020 ccttgatttt cctcgggtac ggcggcctca ccacaccctt gcaaggtgat acaaaatgcc 1080 gtacgcaagg ctgccaacag gtttctcaag atacttgcaa cgaggctctg aagataactt 1140 ggcttggcgg gaaacaagtg gtttctgtga tcattcaggt caatgattac ctgagtgaaa 1200 ggcctaaaat tagggtcacc accattccca ttacccaaaa ctatctcggt gctgagggca 1260 ggctgttgaa gctcggtgat cgggtctata tatatactcg gagcagtggt tggcactctc 1320 aactgcaaat aggggtcttg gacgtgtccc acccgttgac cattaattgg acacctcatg 1380 aggcgctgtc acggccaggg aataaagaat gcaactggta caataagtgc cccaaagaat 1440 gtatctccgg ggtctacaca gacgcttacc ccctgtctcc agatgctgct aatgtcgcta 1500 cagttactct gtacgccaat acttctagag tgaaccccac tattatgtat tccaacacga 1560 ccaatataat caatatgctt cggataaaag atgtacaact tgaagccgct tacactacta 1620 cgtcctgtat aacacacttt gggaaaggct attgctttca catcattgag attaatcaaa 1680 agagtctgaa tactctccaa cccatgctgt ttaaaacatc aatcccaaaa ttgtgtaaag 1740 cggaaagttt ataagatctg aattcacccc accagtg 1777 <210> 504 <211> 576 <212> PRT <213> Respirovirus Sendai Virus HN <400> 504 Met Asp Gly Asp Arg Gly Lys Arg Asp Ser Tyr Trp Ser Thr Ser Pro 1 5 10 15 Ser Gly Ser Thr Thr Lys Pro Ala Ser Gly Trp Glu Arg Ser Ser Lys 20 25 30 Ala Asp Thr Trp Leu Leu Ile Leu Ser Phe Thr Gln Trp Ala Leu Ser 35 40 45 Ile Ala Thr Val Ile Ile Cys Ile Ile Ile Ser Ala Arg Gln Gly Tyr 50 55 60 Ser Met Lys Glu Tyr Ser Met Thr Val Glu Ala Leu Asn Met Ser Ser 65 70 75 80 Arg Glu Val Lys Glu Ser Leu Thr Ser Leu Ile Arg Gln Glu Val Ile 85 90 95 Ala Arg Ala Val Asn Ile Gln Ser Ser Val Gln Thr Gly Ile Pro Val 100 105 110 Leu Leu Asn Lys Asn Ser Arg Asp Val Ile Gln Met Ile Asp Lys Ser 115 120 125 Cys Ser Arg Gln Glu Leu Thr Gln His Cys Glu Ser Thr Ile Ala Val 130 135 140 His His Ala Asp Gly Ile Ala Pro Leu Glu Pro His Ser Phe Trp Arg 145 150 155 160 Cys Pro Val Gly Glu Pro Tyr Leu Ser Ser Asp Pro Glu Ile Ser Leu 165 170 175 Leu Pro Gly Pro Ser Leu Leu Ser Gly Ser Thr Thr Ile Ser Gly Cys 180 185 190 Val Arg Leu Pro Ser Leu Ser Ile Gly Glu Ala Ile Tyr Ala Tyr Ser 195 200 205 Ser Asn Leu Ile Thr Gln Gly Cys Ala Asp Ile Gly Lys Ser Tyr Gln 210 215 220 Val Leu Gln Leu Gly Tyr Ile Ser Leu Asn Ser Asp Met Phe Pro Asp 225 230 235 240 Leu Asn Pro Val Val Ser His Thr Tyr Asp Ile Asn Asp Asn Arg Lys 245 250 255 Ser Cys Ser Val Val Ala Thr Gly Thr Arg Gly Tyr Gln Leu Cys Ser 260 265 270 Met Pro Thr Val Asp Glu Arg Thr Asp Tyr Ser Ser Asp Gly Ile Glu 275 280 285 Asp Leu Val Leu Asp Val Leu Asp Leu Lys Gly Arg Thr Lys Ser His 290 295 300 Arg Tyr Arg Asn Ser Glu Val Asp Leu Asp His Pro Phe Ser Ala Leu 305 310 315 320 Tyr Pro Ser Val Gly Asn Gly Ile Ala Thr Glu Gly Ser Leu Ile Phe 325 330 335 Leu Gly Tyr Gly Gly Leu Thr Thr Pro Leu Gln Gly Asp Thr Lys Cys 340 345 350 Arg Thr Gln Gly Cys Gln Gln Val Ser Gln Asp Thr Cys Asn Glu Ala 355 360 365 Leu Lys Ile Thr Trp Leu Gly Gly Lys Gln Val Val Ser Val Ile Ile 370 375 380 Gln Val Asn Asp Tyr Leu Ser Glu Arg Pro Lys Ile Arg Val Thr Thr 385 390 395 400 Ile Pro Ile Thr Gln Asn Tyr Leu Gly Ala Glu Gly Arg Leu Leu Lys 405 410 415 Leu Gly Asp Arg Val Tyr Ile Tyr Thr Arg Ser Ser Gly Trp His Ser 420 425 430 Gln Leu Gln Ile Gly Val Leu Asp Val Ser His Pro Leu Thr Ile Asn 435 440 445 Trp Thr Pro His Glu Ala Leu Ser Arg Pro Gly Asn Lys Glu Cys Asn 450 455 460 Trp Tyr Asn Lys Cys Pro Lys Glu Cys Ile Ser Gly Val Tyr Thr Asp 465 470 475 480 Ala Tyr Pro Leu Ser Pro Asp Ala Ala Asn Val Ala Thr Val Thr Leu 485 490 495 Tyr Ala Asn Thr Ser Arg Val Asn Pro Thr Ile Met Tyr Ser Asn Thr 500 505 510 Thr Asn Ile Ile Asn Met Leu Arg Ile Lys Asp Val Gln Leu Glu Ala 515 520 525 Ala Tyr Thr Thr Thr Ser Cys Ile Thr His Phe Gly Lys Gly Tyr Cys 530 535 540 Phe His Ile Ile Glu Ile Asn Gln Lys Ser Leu Asn Thr Leu Gln Pro 545 550 555 560 Met Leu Phe Lys Thr Ser Ile Pro Lys Leu Cys Lys Ala Glu Ser Leu 565 570 575 <210> 505 <211> 1590 <212> DNA <213> Alphabaculovirus Autographa californica nuclear polyhedrosis virus <400> 505 atgctgctcg tgaaccagag ccaccagggc ttcaacaagg agcatacatc caaaatggtg 60 tccgccatcg tgctgtacgt gctgctggcc gccgctgccc acagcgcttt tgccgccgag 120 cattgtaatg ctcagatgaa aaccggccct tacaagatca agaacctgga catcacccct 180 cctaaggaga cactgcaaaa agacgtggaa atcaccatcg tggaaaccga ctacaatgag 240 aacgtgatca tcggatataa gggctactac caggcctacg cctacaacgg cggaagcctg 300 gatcctaaca ccagagtgga agagaccatg aagaccctga acgtgggaaa ggaagatctg 360 ctgatgtgga gcatccggca acagtgtgaa gtgggcgaag agctgattga tagatggggc 420 tcagattctg acgattgctt cagagacaac gagggcagag gccagtgggt gaagggcaag 480 gagctggtca agcggcagaa caacaaccac ttcgcccatc acacatgcaa caaaagctgg 540 cggtgcggca tctccacctc taagatgtat tctagactgg aatgtcagga cgacaccgac 600 gagtgccagg tgtacatcct ggacgctgaa ggaaacccta tcaacgtgac agttgacacc 660 gtgctgcacc gggacggcgt gtctatgatc ctgaagcaga agagcacatt caccaccaga 720 cagatcaagg ccgcatgcct gcttatcaaa gacgacaaga acaaccccga gagcgtgacc 780 agagaacact gcctgatcga caacgacatc tacgacctga gcaagaatac ttggaactgt 840 aaattcaaca ggtgcatcaa gcggaaggtg gagcacagag tgaagaagcg tccaccaacc 900 tggcgccaca acgtcagagc caagtacaca gagggcgaca cagccacaaa gggagatctg 960 atgcacatcc aggaggaact gatgtacgag aatgacctgc ttaaaatgaa catcgagctg 1020 atgcacgccc acatcaacaa gctgaacaac atgctgcacg acctgatcgt tagcgtggcc 1080 aaggtggacg agagactgat cggcaatctg atgaacaaca gcgtgtccag caccttcctg 1140 tctgatgaca cctttctgct catgccttgc accaaccccc ccgcccacac cagcaactgc 1200 tacaacaaca gcatctacaa ggaaggcaga tgggtcgcta ataccgatag cagtcagtgc 1260 atcgacttca gcaattacaa ggagctggcc atcgacgatg atgtggagtt ctggattcct 1320 acaattggca acacaaccta ccacgatagc tggaaggacg ccagcggatg gtcttttatc 1380 gcccagcaga aaagcaatct gatcaccacc atggaaaata ccaagttcgg cggcgtgggt 1440 acatctctga gcgacatcac aagcatggcc gagggcgagc tggccgccaa gctgaccagc 1500 ttcatgttcg gccacgtcgt gaacttcgtg atcatcctga tcgtgattct gttcctgtac 1560 tgcatgatca gaaaccggaa cagacaatac 1590 <210> 506 <211> 530 <212> PRT <213> Alphabaculovirus Autographa californica nuclear polyhedrosis virus <400> 506 Met Leu Leu Val Asn Gln Ser His Gln Gly Phe Asn Lys Glu His Thr 1 5 10 15 Ser Lys Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala 20 25 30 Ala His Ser Ala Phe Ala Ala Glu His Cys Asn Ala Gln Met Lys Thr 35 40 45 Gly Pro Tyr Lys Ile Lys Asn Leu Asp Ile Thr Pro Pro Lys Glu Thr 50 55 60 Leu Gln Lys Asp Val Glu Ile Thr Ile Val Glu Thr Asp Tyr Asn Glu 65 70 75 80 Asn Val Ile Ile Gly Tyr Lys Gly Tyr Tyr Gln Ala Tyr Ala Tyr Asn 85 90 95 Gly Gly Ser Leu Asp Pro Asn Thr Arg Val Glu Glu Thr Met Lys Thr 100 105 110 Leu Asn Val Gly Lys Glu Asp Leu Leu Met Trp Ser Ile Arg Gln Gln 115 120 125 Cys Glu Val Gly Glu Glu Leu Ile Asp Arg Trp Gly Ser Asp Ser Asp 130 135 140 Asp Cys Phe Arg Asp Asn Glu Gly Arg Gly Gln Trp Val Lys Gly Lys 145 150 155 160 Glu Leu Val Lys Arg Gln Asn Asn Asn His Phe Ala His His Thr Cys 165 170 175 Asn Lys Ser Trp Arg Cys Gly Ile Ser Thr Ser Lys Met Tyr Ser Arg 180 185 190 Leu Glu Cys Gln Asp Asp Thr Asp Glu Cys Gln Val Tyr Ile Leu Asp 195 200 205 Ala Glu Gly Asn Pro Ile Asn Val Thr Val Asp Thr Val Leu His Arg 210 215 220 Asp Gly Val Ser Met Ile Leu Lys Gln Lys Ser Thr Phe Thr Thr Arg 225 230 235 240 Gln Ile Lys Ala Ala Cys Leu Leu Ile Lys Asp Asp Lys Asn Asn Pro 245 250 255 Glu Ser Val Thr Arg Glu His Cys Leu Ile Asp Asn Asp Ile Tyr Asp 260 265 270 Leu Ser Lys Asn Thr Trp Asn Cys Lys Phe Asn Arg Cys Ile Lys Arg 275 280 285 Lys Val Glu His Arg Val Lys Lys Arg Pro Pro Thr Trp Arg His Asn 290 295 300 Val Arg Ala Lys Tyr Thr Glu Gly Asp Thr Ala Thr Lys Gly Asp Leu 305 310 315 320 Met His Ile Gln Glu Glu Leu Met Tyr Glu Asn Asp Leu Leu Lys Met 325 330 335 Asn Ile Glu Leu Met His Ala His Ile Asn Lys Leu Asn Asn Met Leu 340 345 350 His Asp Leu Ile Val Ser Val Ala Lys Val Asp Glu Arg Leu Ile Gly 355 360 365 Asn Leu Met Asn Asn Ser Val Ser Ser Thr Phe Leu Ser Asp Asp Thr 370 375 380 Phe Leu Leu Met Pro Cys Thr Asn Pro Pro Ala His Thr Ser Asn Cys 385 390 395 400 Tyr Asn Asn Ser Ile Tyr Lys Glu Gly Arg Trp Val Ala Asn Thr Asp 405 410 415 Ser Ser Gln Cys Ile Asp Phe Ser Asn Tyr Lys Glu Leu Ala Ile Asp 420 425 430 Asp Asp Val Glu Phe Trp Ile Pro Thr Ile Gly Asn Thr Thr Tyr His 435 440 445 Asp Ser Trp Lys Asp Ala Ser Gly Trp Ser Phe Ile Ala Gln Gln Lys 450 455 460 Ser Asn Leu Ile Thr Thr Met Glu Asn Thr Lys Phe Gly Gly Val Gly 465 470 475 480 Thr Ser Leu Ser Asp Ile Thr Ser Met Ala Glu Gly Glu Leu Ala Ala 485 490 495 Lys Leu Thr Ser Phe Met Phe Gly His Val Val Asn Phe Val Ile Ile 500 505 510 Leu Ile Val Ile Leu Phe Leu Tyr Cys Met Ile Arg Asn Arg Asn Arg 515 520 525 Gln Tyr 530 <210> 507 <211> 2955 <212> DNA <213> Alphavirus Ross River Virus <400> 507 atgtctgccg cgctgatgat gtgtatcctt gccaacacct ctttcccctg ctcatcacct 60 ccctgctacc cctgctgcta cgaaaaacag ccagaacaga cactgcggat gctggaagac 120 aatgtgaata gaccagggta ctatgagcta ctggaagcgt ccatgacatg cagaaacaga 180 tcacgccacc gccgtagtgt aacagagcac ttcaatgtgt ataaggctac tagaccgtac 240 ttagcgtatt gcgctgactg tggggacggg tacttctgct atagcccagt tgctatcgag 300 aagatccgag atgaggcgcc tgacggcatg ctcaagatcc aagtctccgc ccaaataggt 360 ctggacaagg caggtaccca cgcccacacg aagatccgat atatggctgg tcatgatgtt 420 caggaatcta agagagactc cttgagggtg tacacgtccg cagcgtgctc tatacatggg 480 acgatgggac acttcatcgt cgcacattgt ccgccaggcg actacctcaa ggtttcgttc 540 gaggacgcag attcacacgt gaaggcatgt aaggtccaat acaagcacga cccattgccg 600 gtgggtagag agaagttcgt ggttagaccc cactttggcg tagagctgcc atgcacctca 660 taccagctga caacagctcc caccgacgag gagatcgaca tgcacacacc gccagatata 720 ccggatcgca ccctgctatc acagacggcg ggcaacgtca aaataacagc aggcggcagg 780 actatcaggt acaattgtac ctgtggccgt gacaacgtag gcactaccag tactgacaag 840 accatcaaca catgcaagat tgaccaatgc catgctgccg ttaccagcca tgacaaatgg 900 caatttacct ctccatttgt tcccagggct gatcagacag ctaggagggg caaagtgcat 960 gttccattcc ctttgactaa cgtcacctgc cgagtgccgt tggctcgagc gccggatgtc 1020 acctatggta agaaggaggt gaccctgaga ttacacccag atcatccgac gctcttctcc 1080 tataggagtt taggagccga accgcacccg tacgaggagt gggttgacaa gttctctgag 1140 cgcatcatcc cagtgacgga agaagggatt gagtaccagt ggggcaacaa cccgccggtc 1200 cgcctatggg cgcaactgac gaccgagggc aaaccccatg gctggccaca tgaaatcatt 1260 cagtactatt atggactata ccccgccgcc accattgccg cagtatccgg ggcgagtctg 1320 atggccctcc taactctagc ggccacatgc tgcatgctgg ccaccgcgag gagaaagtgc 1380 ctaacaccat acgccttgac gccaggagcg gtggtaccgt tgacactggg gctgctttgc 1440 tgcgcaccga gggcgaacgc agcatcattc gctgagacta tggcatatct gtgggacgag 1500 aacaaaaccc tcttttggat ggaattcgcc gccccagccg cagcgcttgc tttgctggca 1560 tgctgtatca aaagcctgat ctgctgttgt aagccatttt cttttttagt gttactgagc 1620 ctgggagcct ccgcaaaagc ttacgagcac acagccacaa ttccgaatgt ggtggggttc 1680 ccgtataagg ctcacattga aaggaatggc ttctcgccca tgactctgca gcttgaagtg 1740 gtggagacaa gctgggaacc cacacttaac ctggagtaca ttacctgcga atacaagacg 1800 gtggtccctt cgccattcat caaatgttgc ggaacatcag aatgctcatc caaggagcag 1860 ccagactacc aatgcaaggt gtacacgggt gtatacccat tcatgtgggg tggagcctac 1920 tgtttctgcg actccgagaa cacgcagctc agcgaggcct atgtcgacag gtcagacgtt 1980 tgcaaacatg atcacgcatc ggcctacaag gcacacacgg cctctctaaa agcaacaatc 2040 aggatcagtt atggcaccat caaccagacc accgaggcct tcgttaatgg tgaacacgcg 2100 gtcaacgtgg gcggaagcaa gttcatcttt ggaccgatct caacagcttg gtcaccgttc 2160 gacaataaaa ttgtcgtgta taaagatgat gtctacaacc aggacttccc accctacgga 2220 tcaggccagc cgggtagatt cggagacatt cagagcagga cagtggagag caaagacttg 2280 tatgccaaca cggccctaaa actctcaaga ccatcacccg gggttgtgca tgtgccatac 2340 acgccgacac catccggatt taaatattgg ctgaaggaga aaggatcttc attgaataca 2400 aaggcccctt ttggctgcaa gataaagacc aatccagtca gagccatgga ttgtgcagtt 2460 ggcagtatac ctgtgtcgat ggacatacct gacagtgcat tcacacgagt ggtagatgcc 2520 ccggctgtaa cagacctgag ctgccaggta gtggtctgta cacactcctc cgatttcgga 2580 ggagttgcca cattgtctta caaaacggac aaacccggca agtgcgctgt ccactcacat 2640 tccaacgtcg caacgttgca agaggcgacg gtggatgtca aggaggatgg caaggtcaca 2700 gtgcactttt ccacggcgtc cgcctccccg gccttcaaag tgtccgtctg tgacgcaaaa 2760 acaacgtgca cggcggcgtg cgagcctcca aaagaccaca tcgtccctta tggggcgagc 2820 cataacaacc aggtctttcc ggacatgtca ggaactgcga tgacgtgggt gcagaggctg 2880 gccagtgggt taggtgggct ggctctcatc gcggtggttg tgctggtctt ggtaacctgc 2940 ataacaatgc gtcgg 2955 <210> 508 <211> 985 <212> PRT <213> Alphavirus Ross River Virus <400> 508 Met Ser Ala Ala Leu Met Met Cys Ile Leu Ala Asn Thr Ser Phe Pro 1 5 10 15 Cys Ser Ser Pro Pro Cys Tyr Pro Cys Cys Tyr Glu Lys Gln Pro Glu 20 25 30 Gln Thr Leu Arg Met Leu Glu Asp Asn Val Asn Arg Pro Gly Tyr Tyr 35 40 45 Glu Leu Leu Glu Ala Ser Met Thr Cys Arg Asn Arg Ser Arg His Arg 50 55 60 Arg Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr 65 70 75 80 Leu Ala Tyr Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser Pro 85 90 95 Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Pro Asp Gly Met Leu Lys 100 105 110 Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His Ala 115 120 125 His Thr Lys Ile Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser Lys 130 135 140 Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His Gly 145 150 155 160 Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr Leu 165 170 175 Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys Val 180 185 190 Gln Tyr Lys His Asp Pro Leu Pro Val Gly Arg Glu Lys Phe Val Val 195 200 205 Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu Thr 210 215 220 Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp Ile 225 230 235 240 Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile Thr 245 250 255 Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp Asn 260 265 270 Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile Asp 275 280 285 Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr Ser 290 295 300 Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Arg Gly Lys Val His 305 310 315 320 Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala Arg 325 330 335 Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu His 340 345 350 Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu Pro 355 360 365 His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile Pro 370 375 380 Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro Val 385 390 395 400 Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp Pro 405 410 415 His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr Ile 420 425 430 Ala Ala Val Ser Gly Ala Ser Leu Met Ala Leu Leu Thr Leu Ala Ala 435 440 445 Thr Cys Cys Met Leu Ala Thr Ala Arg Arg Lys Cys Leu Thr Pro Tyr 450 455 460 Ala Leu Thr Pro Gly Ala Val Val Pro Leu Thr Leu Gly Leu Leu Cys 465 470 475 480 Cys Ala Pro Arg Ala Asn Ala Ala Ser Phe Ala Glu Thr Met Ala Tyr 485 490 495 Leu Trp Asp Glu Asn Lys Thr Leu Phe Trp Met Glu Phe Ala Ala Pro 500 505 510 Ala Ala Ala Leu Ala Leu Leu Ala Cys Cys Ile Lys Ser Leu Ile Cys 515 520 525 Cys Cys Lys Pro Phe Ser Phe Leu Val Leu Leu Ser Leu Gly Ala Ser 530 535 540 Ala Lys Ala Tyr Glu His Thr Ala Thr Ile Pro Asn Val Val Gly Phe 545 550 555 560 Pro Tyr Lys Ala His Ile Glu Arg Asn Gly Phe Ser Pro Met Thr Leu 565 570 575 Gln Leu Glu Val Val Glu Thr Ser Trp Glu Pro Thr Leu Asn Leu Glu 580 585 590 Tyr Ile Thr Cys Glu Tyr Lys Thr Val Val Pro Ser Pro Phe Ile Lys 595 600 605 Cys Cys Gly Thr Ser Glu Cys Ser Ser Lys Glu Gln Pro Asp Tyr Gln 610 615 620 Cys Lys Val Tyr Thr Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr 625 630 635 640 Cys Phe Cys Asp Ser Glu Asn Thr Gln Leu Ser Glu Ala Tyr Val Asp 645 650 655 Arg Ser Asp Val Cys Lys His Asp His Ala Ser Ala Tyr Lys Ala His 660 665 670 Thr Ala Ser Leu Lys Ala Thr Ile Arg Ile Ser Tyr Gly Thr Ile Asn 675 680 685 Gln Thr Thr Glu Ala Phe Val Asn Gly Glu His Ala Val Asn Val Gly 690 695 700 Gly Ser Lys Phe Ile Phe Gly Pro Ile Ser Thr Ala Trp Ser Pro Phe 705 710 715 720 Asp Asn Lys Ile Val Val Tyr Lys Asp Asp Val Tyr Asn Gln Asp Phe 725 730 735 Pro Pro Tyr Gly Ser Gly Gln Pro Gly Arg Phe Gly Asp Ile Gln Ser 740 745 750 Arg Thr Val Glu Ser Lys Asp Leu Tyr Ala Asn Thr Ala Leu Lys Leu 755 760 765 Ser Arg Pro Ser Pro Gly Val Val His Val Pro Tyr Thr Pro Thr Pro 770 775 780 Ser Gly Phe Lys Tyr Trp Leu Lys Glu Lys Gly Ser Ser Leu Asn Thr 785 790 795 800 Lys Ala Pro Phe Gly Cys Lys Ile Lys Thr Asn Pro Val Arg Ala Met 805 810 815 Asp Cys Ala Val Gly Ser Ile Pro Val Ser Met Asp Ile Pro Asp Ser 820 825 830 Ala Phe Thr Arg Val Val Asp Ala Pro Ala Val Thr Asp Leu Ser Cys 835 840 845 Gln Val Val Val Cys Thr His Ser Ser Asp Phe Gly Gly Val Ala Thr 850 855 860 Leu Ser Tyr Lys Thr Asp Lys Pro Gly Lys Cys Ala Val His Ser His 865 870 875 880 Ser Asn Val Ala Thr Leu Gln Glu Ala Thr Val Asp Val Lys Glu Asp 885 890 895 Gly Lys Val Thr Val His Phe Ser Thr Ala Ser Ala Ser Pro Ala Phe 900 905 910 Lys Val Ser Val Cys Asp Ala Lys Thr Thr Cys Thr Ala Ala Cys Glu 915 920 925 Pro Pro Lys Asp His Ile Val Pro Tyr Gly Ala Ser His Asn Asn Gln 930 935 940 Val Phe Pro Asp Met Ser Gly Thr Ala Met Thr Trp Val Gln Arg Leu 945 950 955 960 Ala Ser Gly Leu Gly Gly Leu Ala Leu Ile Ala Val Val Val Leu Val 965 970 975 Leu Val Thr Cys Ile Thr Met Arg Arg 980 985 <210> 509 <211> 1575 <212> DNA <213> Artificial Sequence <220> <223> codon optimized rabies virus glycoprotein <400> 509 atggtgcccc aggccctgct cttcgtgcct ctgctcgtct ttccactgtg cttcggcaaa 60 tttcccatct acactattcc tgacaagctg ggaccctgga gtcctatcga tattcaccat 120 ctgtcatgcc ctaacaatct cgtggtcgag gatgaagggt gtaccaacct gtcaggtttc 180 agctacatgg agctgaaagt ggggtatatc ctcgctatta aggtcaacgg cttcacatgc 240 actggagtgg tcaccgaggc agaaacctac acaaattttg tgggctatgt caccacaact 300 ttcaagagga aacactttag accaacaccc gacgcctgtc gcgccgctta caactggaag 360 atggctggcg atccacgata tgaggaatct ctgcacaatc cttacccaga ctatagatgg 420 ctgcggacag tgaagaccac aaaagagagc ctggtcatca ttagcccatc cgtcgcagac 480 ctggatccct acgatagatc cctgcactct cgggtgtttc cctctggcaa gtgcagtgga 540 gtggccgtca gctccactta ctgtagcacc aaccatgatt atactatctg gatgccagag 600 aatccccggc tgggaatgtc ctgcgacatt ttcacatcta gtcgcgggaa gcgagccagt 660 aaagggtcag agacttgtgg ttttgtggac gaaaggggcc tgtataagag cctcaaagga 720 gcttgcaagc tgaaactctg tggcgtgctg ggactcagac tgatggatgg aacctgggtc 780 tcaatgcaga caagcaacga gactaagtgg tgcccccctg acaaactcgt gaatctgcac 840 gacttcaggt ccgatgagat cgaacatctg gtggtcgagg aactcgtgcg aaaaagggag 900 gaatgtctcg atgctctgga gtctatcatg actaccaagt ctgtgagttt taggagactc 960 agtcacctga gaaagctcgt ccctggcttc ggaaaagcat acaccatctt taacaagaca 1020 ctgatggaag cagacgccca ttataaaagc gtggagacct ggaatgaaat cctgccatcc 1080 aagggatgcc tccgagtcgg aggacgctgt caccctcatg tgaacggcgt cttctttaat 1140 ggaatcattc tggggcctga cggtaacgtg ctgatcccag agatgcagtc aagcctgctc 1200 cagcagcaca tggagctgct cgaatcctct gtgattcctc tggtccatcc actcgcagat 1260 ccctctacag tgttcaagga cggggatgag gccgaagact ttgtggaggt ccacctgcca 1320 gatgtgcata accaggtgtc tggggtcgac ctcggtctgc ccaattgggg gaagtacgtg 1380 ctgctcagcg ccggtgcact gactgctctc atgctgatca ttttcctgat gacctgctgt 1440 cgacgagtga accggtccga gcctactcag cacaatctgc gagggaccgg tagagaagtg 1500 tccgtcacac cacagtctgg caaaatcatt agttcatggg agagccataa gtccgggggt 1560 gaaacacgcc tgtga 1575 <210> 510 <211> 524 <212> PRT <213> Lyssavirus Rabies Virus <400> 510 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys 195 200 205 Asp Ile Phe Thr Ser Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Glu 340 345 350 Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 511 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain Nishigahara RCEH <400> 511 acgtgagatc gccaccatgg tgcctcaggc tctgctgctg gtccctatcc tgggattcag 60 ctcctgcttc ggcaagttcc ccatctacac catccctgac accctgggcc cttggtcccc 120 aatcgacatc caccacctga gctgccccaa caacctggtc gtggaggatg aaggctgtac 180 caatctgagc ggcttcagct acatggaact gaaggtggga tatatcagcg ccatcaaggt 240 gaatggcttc acctgcaccg gcgtggtgac cgaggccgag acatacacaa acttcgtggg 300 ctacgtgacc acaaccttca agcggaagca cttcagacct acaccagacg cctgtagagc 360 cgcctacaac tggaagatgg ccggagatcc cagatacgag gaatctctgc acagccccta 420 ccccgactac cactggctga gaaccgtgaa gacaaccaag gaatccctgg tgattatcag 480 ccctagcgtg gccgacctgg acccttacga caacagccta catagcagag tgtttccttc 540 tggcaagtgt agcggcatca ccgtgtccag cgtgtactgc agcaccaacc acgactacac 600 cgtttggatg cctgagagcc tgcggctggg gaccagctgc gacattttta ctaatagcag 660 aggaaaacgg gcttctaaag gatctaaaac ctgtggcttt gtggacgaga gaggcctgta 720 caaatctctg aaaggcgcct gcaagctgaa gctgtgcggc gttctgggcc tcagactgat 780 ggacggcacc tgggttgcta tgcaaacaag caacgagaca aagtggtgtc ctcctgacca 840 gttggtgaac ctgcacgatc tgcggtctga tgagatcgag cacctggtga tcgaggaact 900 ggtcaagaag cgcgaggaat gcctggatgc cctggaaagc atcattacaa ccaaatcagt 960 gtcttttaga cggctgtcct acctgcggaa gctggtgccc ggcttcggca aggcctatac 1020 aatctttaac aagaccctga tggaagcaga agcccactac aagagcgtgc ggacctggaa 1080 cgaaatcatc cctagcaagg gctgcctgag ggtggggggc agatgccacc ctcacgtgaa 1140 cggcgtgttc ttcaacggca tcatcctggg ccctgacggc cacgtgctga tccctgagat 1200 gcagagctct ctgctgcagc agcacatcga gctgctcgag agctctgtga tcccactgat 1260 gcaccccctg gccgatcctt tcaccgtttt caaggacggc gacgaaacag aagatttcat 1320 cgaggtgcat ctgcccgacg tgcacgagca ggtgtctgga gtggacctgg gcctgcctaa 1380 ttggggcgaa tacgtgctgc tgagcgctgg cacccttatc gccctcatgc tgatcatctt 1440 cctgatgacc tgctgcagaa aggtggatag accagagagc acccagcgga gcctgagagg 1500 caccggaaga aacgtgtccg tgacaagcca gagcggcaag ttcatcccca gctgggagtc 1560 ttataagagc ggaggcgaga caggcctgtg aattcacccc accagtg 1607 <210> 512 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain Nishigahara RCEH <400> 512 Met Val Pro Gln Ala Leu Leu Leu Val Pro Ile Leu Gly Phe Ser Ser 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Thr Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Ser Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Asn Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Val Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Val Trp Met Pro Glu Ser Leu Arg Leu Gly Thr Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Leu Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Ile Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Ile Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser Tyr Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Ile Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Phe Thr Val Phe Lys Asp Gly Asp Glu Thr Glu 420 425 430 Asp Phe Ile Glu Val His Leu Pro Asp Val His Glu Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Glu Tyr Val Leu Leu Ser Ala 450 455 460 Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Lys Val Asp Arg Pro Glu Ser Thr Gln Arg Ser Leu Arg Gly Thr 485 490 495 Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Phe Ile Pro Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu 515 520 <210> 513 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain India <400> 513 acgtgagatc gccaccatgg ttcctcaggt gctgctcttc gtgcctctgc tggtcttttc 60 catgtgcttc ggcaaattcc ccatctacac catcccagac aagctgggcc cttggagccc 120 tatcgacatc caccacctga gctgccctaa caacctcgtg gtggaagatg agggctgtac 180 aaacctgtct ggcttttctt atatggagct gaaagtggga tacatcagcg ccatcaaggt 240 gaacggcttc acctgcaccg gcgtggtgac agaggccgag acatacacca acttcgtggg 300 ctacgtgaca accaccttca agagaaagca cttccggcct acccctgacg cctgcagagc 360 cgcttacaac tggaagatgg ccggcgatcc tagatacgag gaaagcctgc ataatcctta 420 tcctgactac cactggctga gaacagtgaa aaccaccaag gaatccctgg tgatcatcag 480 cccctctgta gccgatctgg acccctacga caagagcctg cacagcagag tgttccctag 540 cggaaaatgc agcggtatca ccatctctag cacatactgc agcaccaacc acgactacac 600 gatctggatg cccgagaacc ccagactggg cacctcctgc gacattttta caaatagccg 660 gggcaagcgg gccagcaagg gcggcaagac atgcggcttc gtggacgaga gaggcctgta 720 caaaagcctg aagggcgcct gtaaactgaa gctgtgcgga gtgcttggcc tgcgactgat 780 ggacggcaca tgggtggcca tgcaaacaag cgatgaaacc aagtggtgcc cacctgacca 840 gctggtgaac ctgcatgatt tcagaagcga cgaaatcgag cacctggtgg tcgaggaact 900 ggtgaagaag cgggaggagt gcctggatgc cctggaaagc atcatggcta caaagagcgt 960 gtcatttcgc agactgagcc acctgcggaa gctggtgcct ggcttcggca aagcctacac 1020 catcttcaac aagaccctga tggaagctga tgcccactac aagtctgtgc ggacctggaa 1080 cgagatcatt cccagcaagg gatgtctgag agtgggcgga aggtgccacc cccacgtgaa 1140 tggcgtgttc ttcaacggca tcatcctggg ccccgacggc cacgtgctga tcccagagat 1200 gcagagcagc ctgctgcagc agcacatgga actgctggaa tctagcgtga tccctctgat 1260 gcaccccctg gccgaccctt ctaccgtgtt taaggacgga gatgaggctg aggacttcgt 1320 ggaagtgcat ctccctgacg tgcacaagca gatctctggc gttgatctgg gactgcctag 1380 ctggggcaag tacgtgctgg tgtccgcagg cgtgctggtg gtcctgatgc tgaccatttt 1440 catcatgacc tgttgtggca gagtgcacag acccaagtcc acccagcacg gcctgggcgg 1500 aaccggcaga aaggtgtccg tcaccagcca gtctggcaaa gtaatcagca gctgggagag 1560 ctacaagagt ggaggcgaga caagactgtg aattcacccc accagtg 1607 <210> 514 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain India <400> 514 Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Val Phe Ser Met 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Ile Thr Ile Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Thr Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Gly Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Ala Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Ser Trp Gly Lys Tyr Val Leu Val Ser Ala 450 455 460 Gly Val Leu Val Val Leu Met Leu Thr Ile Phe Ile Met Thr Cys Cys 465 470 475 480 Gly Arg Val His Arg Pro Lys Ser Thr Gln His Gly Leu Gly Gly Thr 485 490 495 Gly Arg Lys Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Ser Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 515 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain CVS-11 <400> 515 acgtgagatc gccaccatgg tgcctcaggt gctgctgttc gtgccactgc tgggatttag 60 cctgtgcttc ggaaaattcc caatctacac catccccgat aagctggggc cttggagccc 120 tatcgacatc caccacctgt catgccccaa caacctggtg gtggaagatg agggctgcac 180 caacctgagc gagttcagct acatggaact gaaagtgggc tacatcagcg ccatcaaggt 240 gaatggcttc acctgcaccg gagtagtgac cgaggccgaa acctacacaa acttcgtggg 300 ctacgtcaca accacattca agagaaagca cttccggccc acccctgatg cttgtagagc 360 cgcttacaac tggaagatgg ccggcgaccc tcggtacgag gaaagcctgc acaaccctta 420 tcctgactac cactggctga gaacagtgag aaccaccaaa gagtctctca tcattatcag 480 ccctagcgtg acagacctgg atccttacga caagtccctc cattctcggg tgtttccagg 540 cggaaagtgc agcggcatca ccgtgagctc tacctactgc agcaccaacc acgactatac 600 aatctggatg cccgagaacc ccagacccag aacaccgtgc gacatcttca ccaacagcag 660 agggaaaaga gccagcaaag gcaacaaaac ctgtggcttc gtggacgaaa gaggcctgta 720 taagtccctg aagggagcct gcagactgaa gctgtgcggc gtgctgggcc ttagactgat 780 ggacggcacc tgggtggcca tgcagacaag cgacgagaca aagtggtgtc ctcctgacca 840 gctggtcaac ctgcatgatt tccgcagtga cgagatcgag cacctggtcg tggaagagct 900 ggttaagaag cgggaagagt gtctggacgc cctggaaagc atcatgacca ccaagagcgt 960 gtccttccgg agactgagcc acctgagaaa gctggtgccc ggctttggca aggcctacac 1020 catctttaac aagaccctga tggaagccga cgcccactac aagagcgtgc ggacctggaa 1080 cgagatcatt cccagcaagg gctgtctgaa agtgggaggc cggtgccacc ctcacgtgaa 1140 tggcgtcttt ttcaacggca tcatcctggg ccctgacggc cacgtgctga ttcctgagat 1200 gcaatctagc ctcctgcagc agcacatgga actgctgaag tctagcgtga tccctctgat 1260 gcaccccctg gccgatcctt ctaccgtgtt caaggaaggc gatgaggccg aggacttcgt 1320 cgaggtgcac cttcctgacg tgtacaagca gatctccggc gtggatctgg gactgcctaa 1380 ttggggcaag tacgtgctga tgacagccgg agctatgatc ggcctggtgc tgatcttctc 1440 cctgatgacc tggtgcagac gggctaatag acctgagtcc aaacagagaa gcttcggcgg 1500 cacaggcagg aacgtgtctg tgacatctca gagcggcaag gtgatcccaa gctgggagag 1560 ttacaagagc ggcggagaaa tcagactgtg aattcacccc accagtg 1607 <210> 516 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain CVS-11 <400> 516 Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Gly Phe Ser Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Gly 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Arg Thr Pro Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Asn Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Lys Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala 450 455 460 Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys 465 470 475 480 Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr 485 490 495 Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Ile Arg Leu 515 520 <210> 517 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain ERA <400> 517 acgtgagatc gccaccatgg tgcctcaggc cctgttgttt gtgccactcc tggtgttccc 60 actgtgcttc ggcaaattcc ctatctacac catcctggat aagctgggcc catggagccc 120 catcgacatc caccacctgt cttgtcctaa caacctggtg gtcgaggatg agggctgcac 180 caatctgagc ggcttcagct acatggagct gaaggtgggc tacatcctgg ccatcaagat 240 gaacggcttc acctgtacag gagtggtgac cgaggccgag acttatacaa acttcgtggg 300 ctacgtgaca acaaccttca agcggaagca cttcagacct acacctgatg cctgtagagc 360 cgcttacaac tggaaaatgg ccggcgatcc aagatacgag gaatctctcc ataatcctta 420 tcctgattac agatggctgc gcaccgtgaa gaccaccaaa gagtccctgg tcatcatctc 480 ccctagcgtg gccgacctgg acccttacga ccggagcctg cacagcagag tgttcccttc 540 cggcaagtgc agcggcgtgg ccgtgagctc cacctactgc tctacaaacc acgactacac 600 catctggatg cctgaaaacc ccagactggg aatgagctgc gacatcttca caaacagccg 660 gggcaagcgg gcctctaagg gcagcgagac ctgcggattt gtggacgaaa gaggcctgta 720 caagagcctc aaaggcgcct gcaagctgaa gctgtgtggc gtgctgggtc tcagactgat 780 ggacggcaca tgggtggcca tgcagaccag caacgagacc aaatggtgcc cccccgacca 840 gctggtgaac ctgcacgact tccggagcga cgagatcgag cacctggtgg tggaagaact 900 ggttagaaag cgggaagagt gcctggacgc tctggaaagc atcatgacca ccaagagcgt 960 ttcttttcgg cggctgagcc acctgagaaa actggtgccc ggcttcggaa aggcctacac 1020 catcttcaac aagacactga tggaagctga tgcccactac aagtctgtga ggacatggaa 1080 cgagattctg cctagcaagg gatgtctgag agtgggcgga agatgccacc cccacgtgaa 1140 tggcgtgttt ttcaacggca tcatcctggg ccctgatggc aacgtgctga tccctgagat 1200 gcaaagcagc ctgctgcagc agcatatgga actgctggaa agctctgtta tccccctggt 1260 gcatcctctg gctgacccca gtaccgtgtt caaggacggc gacgaggctg aggacttcgt 1320 ggaagtgcac ctgcccgatg ttcacaacca ggtgtccggc gtcgacctgg gcctgcctaa 1380 ttggggcaag tacgtgctgc tgagcgccgg cgccctgacc gccctgatgc tgatcatctt 1440 cctgatgaca tgctgcagaa gggttaacag aagcgagcct acccagcaca acctgcgcgg 1500 gaccggcaga gaggtgtctg tgacacctca gtctggaaag atcattagca gctgggagtc 1560 ccacaagagc ggaggagaaa ccagactgtg aattcacccc accagtg 1607 <210> 518 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain ERA <400> 518 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Leu Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Met Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 519 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain SAD B19 <400> 519 acgtgagatc gccaccatgg tgccccaggc ccttctgttc gtgcctctgc tggtctttcc 60 tctgtgtttc ggcaagttcc ccatctacac aatccctgat aagctgggcc cttggtcccc 120 tatcgacatc caccacctgt cttgccctaa caacctggtc gtggaagatg agggctgtac 180 aaatctgagc ggcttcagct acatggaact caaagtgggc tacatcctgg ctatcaaggt 240 gaacggattt acctgtaccg gcgtggtgac cgaggctgaa acctacacca acttcgtggg 300 atatgtgaca accacattca agcggaagca cttccggcct accccagacg cctgcagagc 360 cgcttataac tggaagatgg ccggagatcc tagatacgag gaaagcctgc acaaccctta 420 ccccgattac agatggctgc gcaccgtgaa gaccacaaag gaaagcctgg tgatcatttc 480 tccttctgtc gccgatctgg acccttacga cagaagcctg cacagcagag tgtttcctag 540 cggcaaatgc agcggcgtgg ccgtgagcag tacatactgc agcaccaacc acgactacac 600 catttggatg ccagagaacc ccagactggg catgagctgc gacatcttca ccaacagccg 660 gggaaaacgg gcctctaagg gcagcgagac atgtggcttc gttgacgaga gaggcctgta 720 caagtcactg aagggcgcct gcaagctgaa gctgtgcggc gtcctgggcc taagactgat 780 ggacggcacc tgggtgtcca tgcaaacaag caacgagacc aagtggtgcc cccccgacaa 840 gctggtgaat ctccatgatt tcaggtctga tgagatcgag cacctggtgg tcgaggaact 900 ggtgcggaaa agagaagagt gcctggatgc tcttgagagc atcatgacaa ccaagagcgt 960 gtccttcaga cggctgagcc acctgagaaa gctggttcct ggcttcggca aagcctacac 1020 catcttcaac aagaccctga tggaggccga cgcccactac aagtccgtgc ggacctggaa 1080 cgagatcctg ccaagcaagg gatgtctgcg ggtgggcggc agatgccacc cccacgtgaa 1140 cggcgttttc ttcaacggca tcatcctggg tcctgacgga aatgtgctga tccccgagat 1200 gcagagcagc ctgctgcagc agcacatgga actgctggaa tcttctgtga tcccactggt 1260 gcatcctctg gccgacccta gcacagtgtt taaggacggc gacgaggccg aggacttcgt 1320 ggaagtgcac ctgcccgacg tgcacaacca ggtgagcggc gtggacctgg gtctgcctaa 1380 ttggggcaaa tacgtactgc tgagcgccgg cgctctgacc gccctgatgc tgatcatctt 1440 tctgatgacc tgctgccgga gagtgaacag aagcgagccc acccagcaca atctgagggg 1500 cacaggaaga gaggtgtccg tgacccctca gagcggcaag atcatcagct cttgggaaag 1560 ccacaagagc ggcggagaaa ccagactgtg aattcacccc accagtg 1607 <210> 520 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain SAD B19 <400> 520 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 521 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain Vnukovo-32 <400> 521 acgtgagatc gccaccatgg tgccccaggc cctgcttttc gtgccactgc tggtgttccc 60 tctgtgcttc ggcaagttcc ccatctacac aatccctgat aagctgggcc cttggtcccc 120 tatcgacatc caccacctga gctgtcctaa caacctggtg gtggaggacg agggctgcac 180 aaatctgagc ggcttcagct acatggagct gaaggtgggc tacatcctgg ctatcaagat 240 gaacggattc acctgcaccg gagtggtgac cgaggctgaa aactacacca atttcgtggg 300 ctacgtcacc acgacattca aaagaaagca cctgcggccc acacctgacg cctgtagggc 360 cgcttacaac tggaaaatgg ccggcgaccc tagatacgag gaatccctgc acaaccccta 420 tcctgattac agctggctga ggaccgtgaa gaccaccaag gaaagcctcg tcatcatcag 480 ccctagcgtg gccgatctgg atccttacga cagaagcctc cattctcggg tgtttccaag 540 cggcaagtgc agcggcgttg ccgtgtctag cacctactgc agcaccaacc acgattacac 600 catctggatg cctgagaacc ctagactggg caaaagctgc gacatcttca caaatagcag 660 aggaaaacgg gcctctaagg gcagcgaaac ctgtggcttt gtggacgaga gaggcctgta 720 caagagcctg aaaggcgcct gcaagctgaa actctgcggc gtgctgggcc tgagactgat 780 ggacggcacc tgggtggcca tgcaaaccag caacgagaca aagtggtgcc cacctgacca 840 gctggtgaac ctgcacgact tccggagcga cgagatcgag cacctggtag tggaagagct 900 ggtgcggaag cgggaagagt gcctggacgc tctggaaagc atcatgacca ccaagtccgt 960 gtcttttaga cggctgtccc acctgcggaa gctggtcccc ggcttcggca aggcctatac 1020 catctttaac aagaccctga tggaagccga cgcccactac aagtccgtca gaacctggaa 1080 cgagatcctg cctagcaagg gatgtctgag agtgggcgga agatgccacc cccacgtgaa 1140 cggcgtgttc ttcaacggca tcatcctggg ccccgatggc aacgtgctga tccccgagat 1200 gcagagcagc cttctccagc agcacatgga actgctggaa agctctgtta ttccactggt 1260 gcaccctctg gccgaccctt ctacagtgtt caaggacggc gatgaggccg aggacttcgt 1320 ggaagtgcat ctgcctgatg tgcacaacca ggtgtccgga gtggacctgg gcctgcccaa 1380 ctggggaaaa tacgtgctgc tgagcgccgg agccctgacc gccctgatgc tgatcatttt 1440 cctgatgacc tgttgcagaa gagtgaatag aagcgagcct acacagcaca atctgcgcgg 1500 aacaggcaga gaagtcagcg tgacacctca gacctggaag atcatctcta gttgggagag 1560 tcacaagtct ggcggcgaga caagactgtg aattcacccc accagtg 1607 <210> 522 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain Vnukovo-32 <400> 522 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Met Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Asn Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Leu Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Ser Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Lys Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Thr Trp Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 523 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain Pasteur vaccins / PV <400> 523 acgtgagatc gccaccatgg tcccccaggc cctgctgttc gtgccactgc tggtgtttcc 60 tctctgcttc ggaaaattcc ctatctacac catccccgat aagctgggcc catggagccc 120 catcgacatc caccacctga gctgccccaa caacctggtg gtggaggacg agggctgtac 180 caacctgtcc ggctttagct acatggaact gaaggtgggc tacatcagcg ccatcaagat 240 gaacggcttc acatgtacag gcgtggtgac cgaggctgaa acttatacca acttcgtggg 300 ctatgtgaca accacattca agagaaagca cttccgcccc acccctgatg catgtagagc 360 cgcttacaac tggaagatgg ccggcgaccc tagatacgag gaaagcctgc ataatcctta 420 ccccgactac cactggctga gaacagtgaa gaccaccaag gaatctctgg ttatcatctc 480 accttctgtg gctgacctgg acccctacga cagatccctg cacagcagag tgttccctgg 540 cggcaattgc agcggcgtgg ccgtgtcttc tacatactgc agcacaaacc acgactacac 600 catctggatg cctgagaacc ccagactggg catgagctgc gacatcttca ccaatagccg 660 gggcaagcgg gccagcaagg gcagcgagac ctgtggcttc gtggacgaga gaggcctgta 720 caagagcctg aagggagcct gtaaactgaa gctgtgcggc gtgctgggcc tgcggctgat 780 ggacggcacc tgggtggcca tgcagaccag caacgaaacc aagtggtgcc cacctggaca 840 gctggtgaac ctccatgatt ttcggagcga tgagatcgag caccttgtgg tcgaggaact 900 ggtgaaaaag cgggaagagt gcctggatgc cctggaaagc atcatgacca ccaaaagcgt 960 gtccttcaga agactgtctc acctgagaaa gttggtgcct ggctttggga aggcctacac 1020 catctttaac aagaccctga tggaagccga cgcccactac aagagcgtga ggacctggaa 1080 cgagatcatt ccaagcaagg gctgcctgag agtgggcggt agatgccacc ctcacgtgaa 1140 cggcgtgttc ttcaacggca tcatcctggg ccctgatggc aacgtgctga tccctgagat 1200 gcaatctagc ctgctgcagc agcacatgga actcctggtg tccagcgtga tccctctcat 1260 gcaccccctg gccgatcctt ccacagtgtt caagaacggc gatgaagctg aggacttcgt 1320 tgaggtgcac ctgcctgacg tgcacgagcg gatcagcgga gtggacctgg gactgcctaa 1380 ttggggcaaa tacgtgctgc tgagcgccgg cgccctgacc gccctgatgc tgatcatctt 1440 cctgatgaca tgctggcgga gagtgaatag aagcgagcct acccagcaca acctgcgggg 1500 caccggaaga gaagtgtccg ttacacctca gagcggcaag atcattagca gctgggagtc 1560 ctacaaatct ggcggagaga caggactgtg aattcacccc accagtg 1607 <210> 524 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain Pasteur vaccins / PV <400> 524 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Met Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Gly Gly 165 170 175 Asn Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Gly Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Val Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asn Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Glu Arg Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Trp 465 470 475 480 Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr 485 490 495 Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu 515 520 <210> 525 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain PM1503/AVO1 <400> 525 acgtgagatc gccaccatgg tgcctcaggt gcttctgttc gtgcccctgc tgggcttcag 60 cctgtgcttc ggaaagttcc ctatctacac catccctgat gagctgggac cttggtcccc 120 aatcgacatc caccacctca gctgccctaa caacctggtg gtggaagatg agggctgcac 180 caacctgagc gagttcagct acatggagct gaaggtggga tacatctccg ccatcaaggt 240 gaacggcttt acctgtaccg gcgtggtgac agaagctgaa acctacacaa atttcgtggg 300 ctacgtgaca acaaccttca agagaaagca cttccggccc acccctgacg cttgccgggc 360 tgcttataac tggaagatgg ccggtgaccc cagatacgag gaatccctgc acaaccctta 420 tcctgattac cactggctga ggaccgtgcg gaccaccaaa gagtccctga tcattatcag 480 ccctagcgtg accgacctgg acccttacga caagagcctg cattctagag gctttccagg 540 tggcaagtgc agcggcatca cagtgtctag cacctactgc agcaccaacc acgactacac 600 catctggatg cctgagaacc ccggccctag aaccccgtgc gacatcttca ccaacagcag 660 aggcaaaagg gccagcaagg gcaacaagac atgcggcttc gtggatgaga gaggcctgta 720 caagtccctg aagggcgcct gtcggctgaa gctctgtggc gtgctgggac tgcggttgat 780 ggacggcaca tgggtcgcca tgcaaacatc tgatgagaca aagtggtgcc cccccgacca 840 gctggtcaac ctgcacgatt tcagatctga cgagatcgag cacctggtgg ttgaggaact 900 ggtgaagaaa cgggaagagt gcctggacgc cctggaatcc atcatgacaa caaagagcgt 960 ctccttccgc agactgagcc acctgagaaa gctggtgcct ggctttggca aggcctacac 1020 catctttaac aagacactga tggaagccga cgcccactac aagtctgtgc gaacctggaa 1080 cgagattatc cccagcaaag gctgtctgaa agttggaggc agatgccacc cccacgtgaa 1140 tggagtcttt ttcaacggca tcatcctggg ccctgacggc cacgtgctga tccccgagat 1200 gcagtctagc ctgctgcagc agcacatgga actgctgaag agcagcgtca tcccactgat 1260 gcaccctctg gccgaccctt caacagtgtt caaggaagga gatgaagccg aggacttcgt 1320 ggaagtgcat ctgcctgatg tgtacaaaca gatcagcggc gtggacctgg gcctgccaaa 1380 ttggggcaag tacgtgctga tgaccgccgg cgccatgatc ggcctggtgc tgatcttcag 1440 cctgatgacc tggtgtagaa gagccaatag acctgagtct aagcagagaa gcttcggcgg 1500 caccggacgg aacgtgtccg tgaccagcca gagcgggaaa gtgatcccta gctgggaatc 1560 atatagaagc ggcggcgaga tccggctgtg aattcacccc accagtg 1607 <210> 526 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain PM1503/AVO1 <400> 526 Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Gly Phe Ser Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Glu Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Gly Phe Pro Gly Gly 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Gly Pro Arg Thr Pro Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Asn Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Lys Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala 450 455 460 Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys 465 470 475 480 Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr 485 490 495 Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser 500 505 510 Trp Glu Ser Tyr Arg Ser Gly Gly Glu Ile Arg Leu 515 520 <210> 527 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain China/DRV <400> 527 acgtgagatc gccaccatgg tgccccaagc cctgctgctg gtgcctctgc tgggcttttc 60 cctgtgcttc ggcaagttcc ccatctacac catccccacc aaactgggac cttggagccc 120 tatcgacatc caccacctga gctgccccaa caacctggtg gtggaggatg agggatgcac 180 aaacctgagc ggcttcagct acatggaact gaaggtggga agaatcagcg ccatcaaggt 240 caacggcttc acctgtacag gcgtggtgac cgaggctgaa acatacacaa atttcgtggg 300 atacgtgacc accactttta agagaaagca cttcagacct atgcccggct gcatgtacag 360 ccgggtgcag ctggaagatg gtcgctcccc tcaaatcgag gaatctctgc acaaccccta 420 tcctgattac cactggctga gaaccgtgcg gaccacaaag gaatccctga tcattatctc 480 tccaagcgtg accgacctgg atccttacga caagagcctg cacagcaggg tgttcccagg 540 cagaaagtgc agcgggatca cagtgagcag cacctactgc agcaccaatc acgattatac 600 agtgtggatg cctgagatcc tgcggctggg aacatcttgt gacatcttta caaatagcag 660 aggaaagaga gcctctaagg gcagcaagac ctgcggcttc gtggacgaga gaggcctgta 720 caagtccctg aaaggcgcct gcaagctgaa gctctgtggc gtgcctggcc tcagactgat 780 ggacggcacc tgggtcgcca tgcagaccag caacgagaca aagtggtgcc ctcctggcca 840 gctggtgaac ctgcacgacc tgcatagcga cgaaattgag cacctggtgg tggaagagct 900 ggtgaagaaa agagaggaat gcctggacgc cctggaaagc attaccacaa ccaagagcgt 960 ctccttccgg agactgagcc acctgagaaa gctggtgcct ggctttggaa aggcctacac 1020 catcttcaac aagaccctga tggaagctga ggctcactac aagagcgtgc ggacctggaa 1080 cgagatcatc ccatctaaag gctgccttcg ggttggcggc ggatgtcacc cccacgtgaa 1140 tggcgttttc ttcaacggca tcatcctggg ccctgatggc cacgtgctga tccctgagat 1200 gcagtcttct ctcctgcagc agcacatcga gctgctggaa agcagcgtga tccccctgat 1260 gcaccctctg gccgacccat tcaccgtttt caaagacggc gacgagatcg aggatttcgt 1320 ggaagtgcat ctgcccgacg tgcacgagca ggtgtctggc gtcgacctgg gcctgcctaa 1380 ctggggcgag tacgtgctcc tgagcgccgg cacactgatc gccctgatgc tgatcatctt 1440 tctgatcacc tgctgtaaaa gagtggatag acccgagtct acacagcgga gcctgagagg 1500 caccggaagg aacgtgtccg tgaccagcca gagcggcaag ttcatcccta gcagagaatc 1560 ttacaagtcc ggcggcgaga ccggcctgtg aattcacccc accagtg 1607 <210> 528 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain China/DRV <400> 528 Met Val Pro Gln Ala Leu Leu Leu Val Pro Leu Leu Gly Phe Ser Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Thr Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Arg Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Met Pro Gly Cys 100 105 110 Met Tyr Ser Arg Val Gln Leu Glu Asp Gly Arg Ser Pro Gln Ile Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Arg 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Val Trp Met Pro Glu Ile Leu Arg Leu Gly Thr Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Pro Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro 260 265 270 Pro Gly Gln Leu Val Asn Leu His Asp Leu His Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Thr Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Gly Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Ile Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Phe Thr Val Phe Lys Asp Gly Asp Glu Ile Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Glu Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Glu Tyr Val Leu Leu Ser Ala 450 455 460 Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Ile Thr Cys Cys 465 470 475 480 Lys Arg Val Asp Arg Pro Glu Ser Thr Gln Arg Ser Leu Arg Gly Thr 485 490 495 Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Phe Ile Pro Ser 500 505 510 Arg Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu 515 520 <210> 529 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain China/MRV <400> 529 acgtgagatc gccaccatgg tgccccaggt gctgctgttc gtgttactgc tgggattcag 60 cctgtgtttt ggcaagttcc caatctacac catccccgac gagctgggcc cttggagccc 120 tatcgacatc caccacctgt cctgccccaa caacctggtc gtcgaggacg agggctgtac 180 caacctgagc gagttcagct acatggagct gaaggtgggc tacatcagcg ccatcaaggt 240 gaatggattt acctgtacag gcgtggtgac cgaggccgag acatacacaa acttcgtggg 300 ttatgtgacc accaccttca agagaaagca cttcagacct acacctgacg cgtgcagagc 360 tgcttacaac tggaagatgg ccggagatcc tagatacgag gaatccctgc ataatcctta 420 tcctgattac cactggctgc ggaccgtgcg gacaaccaag gaaagcctga tcatcatcag 480 ccctagcgtt accgacctgg acccctacga caagagcctg cacagcagag tgttccccgg 540 cagaaagtgc agcggcatca ccgtgtccag cacctactgc agcaccaacc acgactacac 600 catctggatg cctgagaacc cccggcctag aacaccgtgc gacatcttca ccaacagcag 660 aggaaaacgc gcttctaacg gcaacaagac atgtggcttc gtggacgaaa gaggcctgta 720 caaaagcctc aagggcgctt gtagactgaa gctgtgcggc gtgctgggcc tgagactgat 780 ggacggcacc tgggtggcca tgcagaccag cggagaaacc aaatggtgcc cacctgatca 840 gctggtgaac cttcatgatt ttagatctga tgagatcgag cacctggtgg tggaagagct 900 ggtcaagaag cgggaggaat gcctggatgc cctggagagc atcatgacca caaagtctgt 960 ctcctttcgg agactgagcc acctgagaaa actggttcct ggcttcggca aggcctacac 1020 catctttaac aagaccctga tggaagccga cgcccactac aagtccgtgc ggacatggaa 1080 tgagattatc ccctctaaag gctgcctgaa agtgggcgga agatgccacc cccacgtgaa 1140 cggtgtgttc ttcaacggcc tgatcctggg acctgacgac cacgtgctga tcccagaaat 1200 gcagagcagc ctgctgcagc aacacatgga actgctggaa tcttctgtga tccctctgat 1260 gcaccctctg gccgatcctt ctacagtgtt caaggaaggc gacgaggccg aggatttcgt 1320 tgaagtgcac ctgcctgacg tgtacaagca gatcagcggc gtggacctgg gccttcctaa 1380 ctggggcaaa tacgtgctga tgacagccgg cgccatgatc ggcctggtgc tcatcttcag 1440 cctgatgacc tggtgcaggc gggccaacag acccgagtcc aagcagagaa gcttcggcgg 1500 cacaggcgga aatgtgtctg tgacatctca gagcggcaag gtgatcccaa gctgggagtc 1560 atacaagagc gggggcgaga ttcggctgtg aattcacccc accagtg 1607 <210> 530 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain China/MRV <400> 530 Met Val Pro Gln Val Leu Leu Phe Val Leu Leu Leu Gly Phe Ser Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Glu Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Arg 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Arg Thr Pro Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Asn Gly Asn Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Gly Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Leu Ile Leu 370 375 380 Gly Pro Asp Asp His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala 450 455 460 Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys 465 470 475 480 Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr 485 490 495 Gly Gly Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Ile Arg Leu 515 520 <210> 531 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus isolate Human/Algeria/1991 <400> 531 acgtgagatc gccaccatgg tgcctcaggc cctgttgttc gtgcccctgc tggtgttccc 60 cctgtgcttc ggcaagttcc ctatctacac cattccagac aagctgggcc cttggtcccc 120 aatcgacatc caccacctgc ggtgccctaa caacctggtg gtcgaggacg agggctgtac 180 caacctgagc ggattcagct acatggaact gaaagtgggc tacatcagcg ccatcaaggt 240 gaatggcttc acctgtaccg gcgtggtgac cgaggccgag acatacacca acttcgtggg 300 ctatgtcaca acaactttta agagaaagca cttccggcct acccctgatg cttgtagagc 360 cgcttacaac tggaagatgg ccggcgaccc tagatacgag gaatccctgc acaaccctta 420 tcctgattac cactggctga gaaccgtgaa gaccacaaag gaaagcctgg tgatcatcag 480 ccctagcgtg gccgatctgg atccttacga caagtccctg cacagcagag tgtttccttc 540 tggcaactgc agcggaatca cagtttctag cacatactgc agcaccaacc acgactacac 600 catctggatg cctgagaacc ccagactgga aaccagctgc gacatcttca ccaatagccg 660 gggcaagaga gcctctaagg gcagcaagac atgcggcttc gtggacgaga gaggcctgta 720 caaaagcctg aagggcgcct gcaaactgaa actgtgtggc gtgctgggac tgagactgat 780 ggacggcacc tgggtggcca tgcaaacatc agatgaaacc aaatggtgcc cacctgacca 840 gctggtgaac ctgcatgact tcagaagcga cgaaatcgag cacctggtgg tggaagagct 900 ggtgaaaaag cgggaagagt gcctggacgc cctggaaagc atcatgacca ccaagagcgt 960 ctccctgaga cggctttctc acctgagaaa gctggtcccc ggctttggca aggcctacac 1020 aatctttaac aagaccctga tggaagctga ggcccactac aagagcgtgc agacctggaa 1080 cgagatcatc cccagcaagg gttgtctgag ggtgggcggc agatgccacc cccacgtgaa 1140 tggagtgttc ttcaatggca tcatcctggg acctgatggc cacgtgctga ttccagagat 1200 gcagagctct ctgctccagc agcacatgga attactcgag agcagcgtga tccctctgat 1260 gcaccctctg gccgacccct ctaccgtgtt taaggacgga gatgaagccg aggatttcgt 1320 tgaagtgcac ctgcctgacg tgcataagca ggtgtccgga gtggacctgg gcctgcccaa 1380 ctggggcaag tacgtgctgc tgagcgctgg cacactgatc gccctgatgc tgatcatctt 1440 cctgatgacc tgctgcagac gcgtgaacag acctaagtcc accgagcgga gcctgggcga 1500 gacaggccgg aaggtgtccg tgaccagcca gtctggcaaa gtgatcagca gctgggagtc 1560 ttacaagagc ggaggcgaga caagacggtg aattcacccc accagtg 1607 <210> 532 <211> 524 <212> PRT <213> Lyssavirus Rabies virus isolate Human/Algeria/1991 <400> 532 Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Arg Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Asn Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Glu Thr Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Leu Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Gln 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala 450 455 460 Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Pro Lys Ser Thr Glu Arg Ser Leu Gly Glu Thr 485 490 495 Gly Arg Lys Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Ser Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Arg 515 520 <210> 533 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain HEP-Flury <400> 533 acgtgagatc gccaccatgg tcccccaggt gctgctgttc gcccctctgc tggtgtttcc 60 actgtgcttc ggcaagttcc ctatctacac aatccctgac aagctcggac cttggtcccc 120 tatcgacctg caccacctgt cctgccccaa caacctggtg gtcgaggacg aaggctgtac 180 caatctgagc ggattcagct acatggagct gaaggtgggc tacatcagcg ccatcaaggt 240 gaacggcttc acatgtacag gcgtggtgac agaggccgaa acatacacca acttcgtggg 300 ctatgtgacc acaacattca aaagaaagca cttcagaccg acccctgatg cctgcagagc 360 cgcttacaac tggaagatgg ccggcgatcc tagatacgag gagtctctgc ataatcctta 420 tcctgattac cactggctgc ggaccgtgaa gacaaccaag gaatctctgg tgatcatttc 480 tccttctgtg acagacctgg atccttacga caagagcctg cacagcagag tcttccccgg 540 cggcaactgc agcggcatca ccgtgtccag cacatactgc agcaccaacc acgactacac 600 catctggatg cctgagaacc tgcggctggg cactagctgc gacatcttta cccactctag 660 aggcaaacgg gccagcaagg gagataagac ctgtggcttt gtggatgaac ggggcctgta 720 caaatccctg aagggagcct gtaaactgaa actgtgcggc gtgctgggtc tgcgcctgat 780 ggacgggacc tgggtggcca tgcaaaccag cgacgagaca aagtggtgcc ctcctggcca 840 gctggtcaac ctccatgatt tcagaagcga cgagatcgag cacctggtgg aagaggagct 900 tgttaagaag agagaagagt gcctggacgc tctggaatcc atcatgacca caaaaagcgt 960 gtcttttcgg cggctgagcc acctgaggaa gctggtgccc ggcttcggca aggcctacac 1020 catcttcaac aagaccctga tggaagctga tgcccactac aaaagcgtgc agacctggaa 1080 cgagatcatc ccttctaagg gatgtctgcg agtgggcgag cggtgccacc ctcacgtgaa 1140 tggcgttttc ttcaacggca tcatcctggg atctgacggc cacgtgctga ttccagagat 1200 gcagagcagc ctgctgcaac agcacatgga gctgctggaa agcagcgtga tccccctgat 1260 gcaccccctg gccgacccca gcaccgtgtt caaggacggc gacgaggtgg aagattttgt 1320 ggaagtccac ttgcctgacg tgcacaagca ggtgtccggc gtggacctgg gcctacccaa 1380 gtggggaaag tacgtgctga tgatcgctgg cgccctgatc gccctgatgc tgattatctt 1440 cctgatgacc tgctgcagaa gagtgaacag acctgagagc acccagtcta atctgggtgg 1500 caccggcaga aacgtgtccg tgcctagcca gagcggcaag gtgatcagca gctgggagag 1560 ctacaagagc ggcggagaaa ccagactgtg aattcacccc accagtg 1607 <210> 534 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain HEP-Flury <400> 534 Met Val Pro Gln Val Leu Leu Phe Ala Pro Leu Leu Val Phe Pro Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Leu His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Gly 165 170 175 Asn Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Leu Arg Leu Gly Thr Ser Cys 195 200 205 Asp Ile Phe Thr His Ser Arg Gly Lys Arg Ala Ser Lys Gly Asp Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Gly Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Glu Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Gln 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Glu 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Ser Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Val Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Lys Trp Gly Lys Tyr Val Leu Met Ile Ala 450 455 460 Gly Ala Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys 465 470 475 480 Arg Arg Val Asn Arg Pro Glu Ser Thr Gln Ser Asn Leu Gly Gly Thr 485 490 495 Gly Arg Asn Val Ser Val Pro Ser Gln Ser Gly Lys Val Ile Ser Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 535 <211> 1607 <212> DNA <213> Lyssavirus Rabies virus strain silver-haired bat-associated <400> 535 acgtgagatc gccaccatga tcccacaggc cctgctgttc gtgcccctgc tgatccccag 60 cctgtgtctg ggcaaattcc ccatctacac cattcctgat aagctgggcc cttggagccc 120 tatcgacatc caccacctga gctgccccaa caacctggtg gtcgaggacg agggctgtac 180 tagcctgtcc ggatttagct acatggagct gaaggtgggc tacatcagcg ccatgaaagt 240 gaacggattc acctgcaccg gcgtggtgac cgaggccgag acatacacca acttcgtcgg 300 atacgtcaca acaacattca agcggaagca cttcagacct atgccagacg cctgcagagc 360 tgctcacgac tggaagatcg ccggcgatcc acggtacgag gacagcctgc aaaatcctta 420 tcctgattac cactggctga ggacagtgaa gaccaccaag gaaagcctag tgatcatcag 480 tccttctgtg gctgatctgg atccttacga caagagcctg cattctagag tgtttcctag 540 cggcaagtgc ctgggtatca ccgtgtctag cacctactgc cctacaaatc acgattacac 600 tatctggatg cctgtggaag ccagactggg aacaagttgc gacatcttta ccaacagccg 660 gggcaagaag gccagcaaag gcggaagaac ctgtggcttt gtggacgaaa gaggccttta 720 taagagcctg aagggcgcct gtaaactgaa gttgtgcgga gttcctggcc tgagactgat 780 gaacggcaca tgggtgtcca tccagaccag cgacgacatc aagtggtgcc ctcccgatca 840 gctggttaat ctgcacgact tccactctga cgagatcgag cacctggtgg tggaggaact 900 gatcaagaaa agagaaggat gtctcgatgc cctggaaagc atcatgacca caaagtccgt 960 ctccttccgg cgcctgagcc acctgagaaa gctggtcccc ggcttcggca aagcctacac 1020 catcttcaac aacaccctga tggaagccga cgcgcactac aagtctgtta gaacctggaa 1080 cgaggtgatc ccttctaaag gctgcctgaa ggtgggaggc agatgccacc ctcctgtgaa 1140 cggcgtgttc ttcaacggca tcatcctggg cccagacggc aacgtgctga tccctgagat 1200 gcagagctct ctgctgcagc agcacatgga actgctcgaa agcagcgtga tccccctgat 1260 gcaccccctg gctgacccct ccaccgtgtt caaggacggc gacgaggctg aagatttcgt 1320 ggaagtgcac ctgcccgacg tgcataagca ggtgtccgac gtggacctgg gcctgcctag 1380 ctggggcaag tacctgctca tgagcgccgg agccctggcc accctgattc tggccatctt 1440 cctgattaca tgctgcagac gggccaatcg gaccaagtct acccagcggg gccacagaga 1500 gagcggcggc aaggtgagcg tggcccctca aaacggcaaa atcatcagca gctgggagct 1560 gtacaagagc gagagcgaga caggcatgtg aattcacccc accagtg 1607 <210> 536 <211> 524 <212> PRT <213> Lyssavirus Rabies virus strain silver-haired bat-associated <400> 536 Met Ile Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Ile Pro Ser Leu 1 5 10 15 Cys Leu Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Ser Leu Ser Gly Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Met Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Met Pro Asp Ala 100 105 110 Cys Arg Ala Ala His Asp Trp Lys Ile Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Asp Ser Leu Gln Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly 165 170 175 Lys Cys Leu Gly Ile Thr Val Ser Ser Thr Tyr Cys Pro Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Val Glu Ala Arg Leu Gly Thr Ser Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Lys Ala Ser Lys Gly Gly Arg 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Lys Leu Lys Leu Cys Gly Val Pro Gly Leu Arg Leu Met Asn 245 250 255 Gly Thr Trp Val Ser Ile Gln Thr Ser Asp Asp Ile Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe His Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Ile Lys Lys Arg Glu Gly Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Asn Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Val Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly 355 360 365 Arg Cys His Pro Pro Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu 370 375 380 Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Asp 435 440 445 Val Asp Leu Gly Leu Pro Ser Trp Gly Lys Tyr Leu Leu Met Ser Ala 450 455 460 Gly Ala Leu Ala Thr Leu Ile Leu Ala Ile Phe Leu Ile Thr Cys Cys 465 470 475 480 Arg Arg Ala Asn Arg Thr Lys Ser Thr Gln Arg Gly His Arg Glu Ser 485 490 495 Gly Gly Lys Val Ser Val Ala Pro Gln Asn Gly Lys Ile Ile Ser Ser 500 505 510 Trp Glu Leu Tyr Lys Ser Glu Ser Glu Thr Gly Met 515 520 <210> 537 <211> 2715 <212> DNA <213> Simplexvirus Herpes simplex virus type 2 <400> 537 atgcggggtg gcggactgat atgtgcactg gtagttgggg cattggtggc agctgtcgca 60 tctgccgctc ctgccgcgcc agcagctcct cgtgcttcag gtggggtagc tgctactgtg 120 gcagccaatg gcgggcctgc aagtcgtcca ccacctgtac cttcccctgc cacgacgaaa 180 gctaggaaaa gaaagacaaa gaaaccccca aaacgcccgg aagccacacc accgcctgat 240 gctaatgcca cagtggctgc aggacatgct acactccgag cacatcttag agagattaaa 300 gtggaaaatg ctgacgctca attctatgtt tgtcccccac caacaggagc taccgtcgtt 360 caattcgaac aacccagacg atgtcccacc cggccagaag gacaaaatta tactgaaggt 420 attgccgtcg tgtttaaaga aaatattgca ccctataagt ttaaagcaac tatgtattac 480 aaggacgtca cagtctccca agtatggttt ggacatcggt atagccaatt catgggcatc 540 tttgaagata gggcacctgt gccttttgaa gaagtcatag ataaaatcaa tgctaaaggc 600 gtgtgtcgtt ctactgcaaa atatgtacgc aataatatgg aaactacagc cttccataga 660 gatgatcatg aaactgatat ggaactgaaa cccgcaaaag tagcaacccg gacaagtcga 720 ggatggcata caacggattt gaaatataat ccttctcgag tagaagcctt tcacaggtat 780 ggtaccaccg ttaattgtat agttgaagaa gttgatgcta ggagcgttta tccatatgac 840 gaattcgttc tggccacagg agatttcgtt tatatgagcc cattctatgg atatagagaa 900 ggttctcata ctgaacatac gtcctatgca gcagatcgat ttaaacaagt ggatggattt 960 tatgcccggg atctgacgac aaaagcacga gcaacctcac ctaccacaag aaatcttctc 1020 actacaccaa aattcacagt cgcgtgggat tgggtaccta aaagacccgc cgtttgtaca 1080 atgactaaat ggcaagaagt cgatgaaatg ttgcgtgcag aatatggcgg aagctttagg 1140 ttttcatctg atgcaattag cactacattt actacgaatc tcacgcaata tagtctgtct 1200 agagtggatc ttggtgattg tatagggcgc gacgcaagag aagctattga tcgaatgttc 1260 gcaagaaaat ataatgctac ccatataaaa gttgggcaac cacaatatta tttggcgaca 1320 ggcggttttc tgatagccta tcaaccactg ctgtccaata ccttggctga actctatgtt 1380 agggaatata tgagagaaca agataggaaa ccaaggaacg cgaccccagc acctcttagg 1440 gaagctccat ctgcaaatgc tagcgttgaa agaattaaaa caacatcttc catagaattt 1500 gcaaggttgc aattcacata caatcatatt caacggcatg ttaatgatat gctcggccgg 1560 attgctgtgg catggtgtga acttcaaaat catgaactca cgctgtggaa tgaagcgagg 1620 aaactgaatc ctaatgctat tgctagtgct acggttggaa ggcgagtttc agctagaatg 1680 cttggtgatg tgatggctgt ttcaacttgt gtaccggtgg cacccgataa tgtcattgtt 1740 caaaattcca tgcgggtatc atcaagacca ggtacatgtt atagtcggcc gctcgtgtcc 1800 ttcagatatg aggatcaagg accacttatt gaaggacaac ttggtgaaaa taatgaactt 1860 cggctgacta gagatgcttt ggaaccatgt acagttggtc atcgtcggta ttttattttc 1920 ggaggaggtt atgtttattt tgaagaatat gcttatagcc atcagttgtc cagggctgat 1980 gtgactacag tgtctacatt tattgatctt aacataacta tgctcgaaga tcatgaattc 2040 gtcccacttg aagtgtatac ccgtcatgaa attaaagatt ctggtctcct tgattatacc 2100 gaagtacaac ggcggaatca actccatgat ctcagattcg ctgatattga tacagtaatt 2160 cgggcagatg caaatgctgc tatgtttgca ggtctttgtg ccttcttcga aggcatggga 2220 gatctgggtc gggccgttgg gaaagtggtg atgggcgtgg tcggcggagt cgtatctgcg 2280 gtttctgggg tttcaagttt catgagtaat ccttttggcg ccctggcagt tggcctgctc 2340 gtacttgcgg gtcttgtagc cgcgttcttc gcgtttcggt atgtgcttca gcttcagagg 2400 aaccctatga aagcgctcta ccccctgaca actaaagagc tgaaaacgtc tgatcctggt 2460 ggggtcggcg gagaaggaga agagggagca gaaggcggcg gattcgatga agcaaaactc 2520 gctgaagcta gggagatgat aagatacatg gcgcttgtaa gtgcgatgga acggactgag 2580 cataaagctc gtaagaaagg aacttctgct ctcctgtctt ctaaagtaac taatatggtc 2640 ttgcggaaaa ggaataaggc acgatattct cccctgcata atgaagatga agcaggcgat 2700 gaggatgaac tgtga 2715 <210> 538 <211> 904 <212> PRT <213> Simplexvirus Herpes simplex virus type 2 <400> 538 Met Arg Gly Gly Gly Leu Ile Cys Ala Leu Val Val Gly Ala Leu Val 1 5 10 15 Ala Ala Val Ala Ser Ala Ala Pro Ala Ala Pro Ala Ala Pro Arg Ala 20 25 30 Ser Gly Gly Val Ala Ala Thr Val Ala Ala Asn Gly Gly Pro Ala Ser 35 40 45 Arg Pro Pro Pro Val Pro Ser Pro Ala Thr Thr Lys Ala Arg Lys Arg 50 55 60 Lys Thr Lys Lys Pro Pro Lys Arg Pro Glu Ala Thr Pro Pro Pro Asp 65 70 75 80 Ala Asn Ala Thr Val Ala Ala Gly His Ala Thr Leu Arg Ala His Leu 85 90 95 Arg Glu Ile Lys Val Glu Asn Ala Asp Ala Gln Phe Tyr Val Cys Pro 100 105 110 Pro Pro Thr Gly Ala Thr Val Val Gln Phe Glu Gln Pro Arg Arg Cys 115 120 125 Pro Thr Arg Pro Glu Gly Gln Asn Tyr Thr Glu Gly Ile Ala Val Val 130 135 140 Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys Ala Thr Met Tyr Tyr 145 150 155 160 Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly His Arg Tyr Ser Gln 165 170 175 Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val Pro Phe Glu Glu Val 180 185 190 Ile Asp Lys Ile Asn Ala Lys Gly Val Cys Arg Ser Thr Ala Lys Tyr 195 200 205 Val Arg Asn Asn Met Glu Thr Thr Ala Phe His Arg Asp Asp His Glu 210 215 220 Thr Asp Met Glu Leu Lys Pro Ala Lys Val Ala Thr Arg Thr Ser Arg 225 230 235 240 Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro Ser Arg Val Glu Ala 245 250 255 Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile Val Glu Glu Val Asp 260 265 270 Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val Leu Ala Thr Gly Asp 275 280 285 Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg Glu Gly Ser His Thr 290 295 300 Glu His Thr Ser Tyr Ala Ala Asp Arg Phe Lys Gln Val Asp Gly Phe 305 310 315 320 Tyr Ala Arg Asp Leu Thr Thr Lys Ala Arg Ala Thr Ser Pro Thr Thr 325 330 335 Arg Asn Leu Leu Thr Thr Pro Lys Phe Thr Val Ala Trp Asp Trp Val 340 345 350 Pro Lys Arg Pro Ala Val Cys Thr Met Thr Lys Trp Gln Glu Val Asp 355 360 365 Glu Met Leu Arg Ala Glu Tyr Gly Gly Ser Phe Arg Phe Ser Ser Asp 370 375 380 Ala Ile Ser Thr Thr Phe Thr Thr Asn Leu Thr Gln Tyr Ser Leu Ser 385 390 395 400 Arg Val Asp Leu Gly Asp Cys Ile Gly Arg Asp Ala Arg Glu Ala Ile 405 410 415 Asp Arg Met Phe Ala Arg Lys Tyr Asn Ala Thr His Ile Lys Val Gly 420 425 430 Gln Pro Gln Tyr Tyr Leu Ala Thr Gly Gly Phe Leu Ile Ala Tyr Gln 435 440 445 Pro Leu Leu Ser Asn Thr Leu Ala Glu Leu Tyr Val Arg Glu Tyr Met 450 455 460 Arg Glu Gln Asp Arg Lys Pro Arg Asn Ala Thr Pro Ala Pro Leu Arg 465 470 475 480 Glu Ala Pro Ser Ala Asn Ala Ser Val Glu Arg Ile Lys Thr Thr Ser 485 490 495 Ser Ile Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asn His Ile Gln Arg 500 505 510 His Val Asn Asp Met Leu Gly Arg Ile Ala Val Ala Trp Cys Glu Leu 515 520 525 Gln Asn His Glu Leu Thr Leu Trp Asn Glu Ala Arg Lys Leu Asn Pro 530 535 540 Asn Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val Ser Ala Arg Met 545 550 555 560 Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro Val Ala Pro Asp 565 570 575 Asn Val Ile Val Gln Asn Ser Met Arg Val Ser Ser Arg Pro Gly Thr 580 585 590 Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu Asp Gln Gly Pro 595 600 605 Leu Ile Glu Gly Gln Leu Gly Glu Asn Asn Glu Leu Arg Leu Thr Arg 610 615 620 Asp Ala Leu Glu Pro Cys Thr Val Gly His Arg Arg Tyr Phe Ile Phe 625 630 635 640 Gly Gly Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr Ser His Gln Leu 645 650 655 Ser Arg Ala Asp Val Thr Thr Val Ser Thr Phe Ile Asp Leu Asn Ile 660 665 670 Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu Val Tyr Thr Arg 675 680 685 His Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr Glu Val Gln Arg 690 695 700 Arg Asn Gln Leu His Asp Leu Arg Phe Ala Asp Ile Asp Thr Val Ile 705 710 715 720 Arg Ala Asp Ala Asn Ala Ala Met Phe Ala Gly Leu Cys Ala Phe Phe 725 730 735 Glu Gly Met Gly Asp Leu Gly Arg Ala Val Gly Lys Val Val Met Gly 740 745 750 Val Val Gly Gly Val Val Ser Ala Val Ser Gly Val Ser Ser Phe Met 755 760 765 Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu Ala Gly 770 775 780 Leu Val Ala Ala Phe Phe Ala Phe Arg Tyr Val Leu Gln Leu Gln Arg 785 790 795 800 Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Glu Leu Lys Thr 805 810 815 Ser Asp Pro Gly Gly Val Gly Gly Glu Gly Glu Glu Gly Ala Glu Gly 820 825 830 Gly Gly Phe Asp Glu Ala Lys Leu Ala Glu Ala Arg Glu Met Ile Arg 835 840 845 Tyr Met Ala Leu Val Ser Ala Met Glu Arg Thr Glu His Lys Ala Arg 850 855 860 Lys Lys Gly Thr Ser Ala Leu Leu Ser Ser Lys Val Thr Asn Met Val 865 870 875 880 Leu Arg Lys Arg Asn Lys Ala Arg Tyr Ser Pro Leu His Asn Glu Asp 885 890 895 Glu Ala Gly Asp Glu Asp Glu Leu 900 <210> 539 <211> 1182 <212> DNA <213> Simplexvirus Herpes simplex virus type 2 <400> 539 atggggcgtt tgacctccgg cgtcgggacg gcggccctgc tagttgtcgc ggtgggactc 60 cgcgtcgtct gcgccaaata cgccttagca gacccctcgc ttaagatggc cgatcccaat 120 cgatttcgcg ggaagaacct tccggttttg gaccagctga ccgacccccc cggggtgaag 180 cgtgtttacc acattcagcc gagcctggag gacccgttcc agccccccag catcccgatc 240 actgtgtact acgcagtgct ggaacgtgcc tgccgcagcg tgctcctaca tgccccatcg 300 gaggcccccc agatcgtgcg cggggcttcg gacgaggccc gaaagcacac gtacaacctg 360 accatcgcct ggtatcgcat gggagacaat tgcgctatcc ccatcacggt tatggaatac 420 accgagtgcc cctacaacaa gtcgttgggg gtctgcccca tccgaacgca gccccgctgg 480 agctactatg acagctttag cgccgtcagc gaggataacc tgggattcct gatgcacgcc 540 cccgccttcg agaccgcggg tacgtacctg cggctagtga agataaacga ctggacggag 600 atcacacaat ttatcctgga gcaccgggcc cgcgcctcct gcaagtacgc tctccccctg 660 cgcatccccc cggcagcgtg cctcacctcg aaggcctacc aacagggcgt gacggtcgac 720 agcatcggga tgttaccccg ctttactccc gaaaaccagc gcaccgtcgc cctatacagc 780 ttaaaaatcg ccgggtggca cggccccaag cccccgtaca ccagcaccct gctgccgccg 840 gagctgtccg acaccaccaa cgccacgcaa cccgaactcg ttccggaaga ccccgaggac 900 tcggccctct tagaggatcc cgccgggacg gtgtcttcgc agatcccccc aaactggcac 960 atcccgtcga tccaggacgt cgcgccgcac cacgcccccg ccgccccagc caacccgggc 1020 ctgatcatcg gcgcgctggc cggcagtacc ctggcggcgc tggtcatcgg cggtattgcg 1080 ttttgggtac gccgccggcg ctcagtggcc cccaagcgcc tacgtctccc ccacatccgg 1140 gatgacgacg cgcccccctc gcaccagcca ttgttttact ag 1182 <210> 540 <211> 393 <212> PRT <213> Simplexvirus Herpes simplex virus type 2 <400> 540 Met Gly Arg Leu Thr Ser Gly Val Gly Thr Ala Ala Leu Leu Val Val 1 5 10 15 Ala Val Gly Leu Arg Val Val Cys Ala Lys Tyr Ala Leu Ala Asp Pro 20 25 30 Ser Leu Lys Met Ala Asp Pro Asn Arg Phe Arg Gly Lys Asn Leu Pro 35 40 45 Val Leu Asp Gln Leu Thr Asp Pro Pro Gly Val Lys Arg Val Tyr His 50 55 60 Ile Gln Pro Ser Leu Glu Asp Pro Phe Gln Pro Pro Ser Ile Pro Ile 65 70 75 80 Thr Val Tyr Tyr Ala Val Leu Glu Arg Ala Cys Arg Ser Val Leu Leu 85 90 95 His Ala Pro Ser Glu Ala Pro Gln Ile Val Arg Gly Ala Ser Asp Glu 100 105 110 Ala Arg Lys His Thr Tyr Asn Leu Thr Ile Ala Trp Tyr Arg Met Gly 115 120 125 Asp Asn Cys Ala Ile Pro Ile Thr Val Met Glu Tyr Thr Glu Cys Pro 130 135 140 Tyr Asn Lys Ser Leu Gly Val Cys Pro Ile Arg Thr Gln Pro Arg Trp 145 150 155 160 Ser Tyr Tyr Asp Ser Phe Ser Ala Val Ser Glu Asp Asn Leu Gly Phe 165 170 175 Leu Met His Ala Pro Ala Phe Glu Thr Ala Gly Thr Tyr Leu Arg Leu 180 185 190 Val Lys Ile Asn Asp Trp Thr Glu Ile Thr Gln Phe Ile Leu Glu His 195 200 205 Arg Ala Arg Ala Ser Cys Lys Tyr Ala Leu Pro Leu Arg Ile Pro Pro 210 215 220 Ala Ala Cys Leu Thr Ser Lys Ala Tyr Gln Gln Gly Val Thr Val Asp 225 230 235 240 Ser Ile Gly Met Leu Pro Arg Phe Thr Pro Glu Asn Gln Arg Thr Val 245 250 255 Ala Leu Tyr Ser Leu Lys Ile Ala Gly Trp His Gly Pro Lys Pro Pro 260 265 270 Tyr Thr Ser Thr Leu Leu Pro Pro Glu Leu Ser Asp Thr Thr Asn Ala 275 280 285 Thr Gln Pro Glu Leu Val Pro Glu Asp Pro Glu Asp Ser Ala Leu Leu 290 295 300 Glu Asp Pro Ala Gly Thr Val Ser Ser Gln Ile Pro Pro Asn Trp His 305 310 315 320 Ile Pro Ser Ile Gln Asp Val Ala Pro His His Ala Pro Ala Ala Pro 325 330 335 Ala Asn Pro Gly Leu Ile Ile Gly Ala Leu Ala Gly Ser Thr Leu Ala 340 345 350 Ala Leu Val Ile Gly Gly Ile Ala Phe Trp Val Arg Arg Arg Arg Ser 355 360 365 Val Ala Pro Lys Arg Leu Arg Leu Pro His Ile Arg Asp Asp Asp Ala 370 375 380 Pro Pro Ser His Gln Pro Leu Phe Tyr 385 390 <210> 541 <211> 2517 <212> DNA <213> Simplexvirus Herpes simplex virus type 2 <400> 541 atgggtccag gcttgtgggt tgtgatgggt gtgttggttg gtgtcgcagg cggacacgat 60 acctattgga ccgaacagat tgatccttgg ttcctgcatg ggcttggact tgcgaggacc 120 tattggagag ataccaatac aggacggctt tggctgccaa atactcctga tgcatccgat 180 cctcaaagag ggcggcttgc accaccaggt gagctgaatc tcacaactgc cagcgtccca 240 atgttgcgct ggtatgcaga acggttctgc tttgtcctcg taactacagc tgaattcccc 300 cgcgatcctg gacaactcct gtatattcct aaaacttacc tgctggggag accacgcaat 360 gcttctttgc cagaattgcc tgaagccggt ccgacaagca ggccaccagc agaagtcact 420 caactgaaag ggttgtctca taatccaggg gctagcgctc ttctcagaag tagagcatgg 480 gttacctttg ctgcagcccc agatagggaa ggactgacct ttccccgtgg cgatgatggc 540 gctacagaaa gacatcccga tggaaggaga aatgctccac cccctggtcc ccctgccggc 600 acaccccgac acccaacaac aaatctttcc atagcccacc tgcataatgc ttcagttact 660 tggttggcgg ctcggggttt gctgagaacc cctggcagat atgtctatct tagtcctagt 720 gcgagtacct ggcctgtcgg agtgtggacc accggtggcc ttgcctttgg atgtgatgcg 780 gcccttgtta gagccaggta tggaaaagga tttatgggct tggttattag tatgagagat 840 tctccccctg cagaaattat tgtagtacca gcagataaaa ctctggcgcg tgtggggaac 900 ccaactgatg agaatgcacc agctgtcctt cctggcccac ccgcgggacc tcgttacagg 960 gtgttcgtac tcggcgcgcc cacaccggca gataatgggt cagctctcga tgcactgaga 1020 cgtgttgctg ggtatcctga agaatctaca aattatgctc aatacatgag tagagcttac 1080 gccgaattcc tcggcgaaga tccaggtagc gggacagatg caaggccaag tctcttttgg 1140 cgcctggctg gcctcttggc ttcaagcgga ttcgcctttg ttaatgccgc tcatgcacat 1200 gatgcaatcc ggctgtcaga tctcctcggt ttcctggcgc attctagggt tcttgctggt 1260 ttggcggcac gaggggctgc aggatgtgcc gcagattcag tatttcttaa tgtatctgta 1320 cttgatcccg ctgctaggct cagattggaa gcacgactgg gccacctcgt cgcagctatt 1380 ttggaaagag aacaatccct cgtagcccat gcacttggtt accaacttgc ctttgttctg 1440 gatagtccag ccgcttacgg agccgtcgca ccaagtgccg cacggttgat tgatgctctt 1500 tatgctgaat tcctgggtgg tcgagcattg acagctccaa tggtaaggcg ggccttgttc 1560 tatgcgaccg cggttttgcg agcccctttt ctcgccggtg ccccaagcgc tgaacaaaga 1620 gagagggctc gaaggggatt gctgatcact accgctttgt gcacatcaga tgtagcagct 1680 gctactcatg ctgaccttcg tgcagccctg gcgcgcacgg atcatcaaaa gaatctgttt 1740 tggctgcctg atcatttctc accttgtgcc gcgtcactcc ggtttgacct tgcagaaggc 1800 ggatttatat tggatgcact tgcaatggct acacgcagtg atattccagc tgatgtaatg 1860 gcccagcaaa cacgcggggt cgctagcgtg ctgactaggt gggcccatta taatgctctt 1920 ataagagcat ttgtgcctga agctactcat caatgcagtg gtcccagcca taatgcagaa 1980 cctaggattc ttgtcccgat tactcataat gcatcctatg ttgtgactca tactcctctc 2040 ccaaggggaa ttggttataa attgaccgga gtcgatgtga gacgacctct tttcattacg 2100 tacctgactg ctacgtgtga gggtcatgcc agagaaatcg aaccaaagag actcgtccgg 2160 actgagaata ggcgagattt gggactggtc ggcgcagttt tcctgcgata tactcccgca 2220 ggagaagtta tgtccgtttt gctcgtagat accgacgcga ctcagcaaca acttgcacaa 2280 ggccctgttg ctggaacacc aaatgttttc tcttcagatg taccatcagt tgcgttgctt 2340 ctgtttccta atgggacagt catacacttg ctcgctttcg atacccttcc tattgcaact 2400 attgcaccgg gcttcctcgc agcaagcgct ttgggcgtgg taatgatcac agcagcactt 2460 gctgggatac tccgcgtcgt gcgtacatgt gtgcctttcc tgtggcgtag ggagtag 2517 <210> 542 <211> 838 <212> PRT <213> Simplexvirus Herpes simplex virus type 2 <400> 542 Met Gly Pro Gly Leu Trp Val Val Met Gly Val Leu Val Gly Val Ala 1 5 10 15 Gly Gly His Asp Thr Tyr Trp Thr Glu Gln Ile Asp Pro Trp Phe Leu 20 25 30 His Gly Leu Gly Leu Ala Arg Thr Tyr Trp Arg Asp Thr Asn Thr Gly 35 40 45 Arg Leu Trp Leu Pro Asn Thr Pro Asp Ala Ser Asp Pro Gln Arg Gly 50 55 60 Arg Leu Ala Pro Pro Gly Glu Leu Asn Leu Thr Thr Ala Ser Val Pro 65 70 75 80 Met Leu Arg Trp Tyr Ala Glu Arg Phe Cys Phe Val Leu Val Thr Thr 85 90 95 Ala Glu Phe Pro Arg Asp Pro Gly Gln Leu Leu Tyr Ile Pro Lys Thr 100 105 110 Tyr Leu Leu Gly Arg Pro Arg Asn Ala Ser Leu Pro Glu Leu Pro Glu 115 120 125 Ala Gly Pro Thr Ser Arg Pro Pro Ala Glu Val Thr Gln Leu Lys Gly 130 135 140 Leu Ser His Asn Pro Gly Ala Ser Ala Leu Leu Arg Ser Arg Ala Trp 145 150 155 160 Val Thr Phe Ala Ala Ala Pro Asp Arg Glu Gly Leu Thr Phe Pro Arg 165 170 175 Gly Asp Asp Gly Ala Thr Glu Arg His Pro Asp Gly Arg Arg Asn Ala 180 185 190 Pro Pro Pro Gly Pro Pro Ala Gly Thr Pro Arg His Pro Thr Thr Asn 195 200 205 Leu Ser Ile Ala His Leu His Asn Ala Ser Val Thr Trp Leu Ala Ala 210 215 220 Arg Gly Leu Leu Arg Thr Pro Gly Arg Tyr Val Tyr Leu Ser Pro Ser 225 230 235 240 Ala Ser Thr Trp Pro Val Gly Val Trp Thr Thr Gly Gly Leu Ala Phe 245 250 255 Gly Cys Asp Ala Ala Leu Val Arg Ala Arg Tyr Gly Lys Gly Phe Met 260 265 270 Gly Leu Val Ile Ser Met Arg Asp Ser Pro Pro Ala Glu Ile Ile Val 275 280 285 Val Pro Ala Asp Lys Thr Leu Ala Arg Val Gly Asn Pro Thr Asp Glu 290 295 300 Asn Ala Pro Ala Val Leu Pro Gly Pro Pro Ala Gly Pro Arg Tyr Arg 305 310 315 320 Val Phe Val Leu Gly Ala Pro Thr Pro Ala Asp Asn Gly Ser Ala Leu 325 330 335 Asp Ala Leu Arg Arg Val Ala Gly Tyr Pro Glu Glu Ser Thr Asn Tyr 340 345 350 Ala Gln Tyr Met Ser Arg Ala Tyr Ala Glu Phe Leu Gly Glu Asp Pro 355 360 365 Gly Ser Gly Thr Asp Ala Arg Pro Ser Leu Phe Trp Arg Leu Ala Gly 370 375 380 Leu Leu Ala Ser Ser Gly Phe Ala Phe Val Asn Ala Ala His Ala His 385 390 395 400 Asp Ala Ile Arg Leu Ser Asp Leu Leu Gly Phe Leu Ala His Ser Arg 405 410 415 Val Leu Ala Gly Leu Ala Ala Arg Gly Ala Ala Gly Cys Ala Ala Asp 420 425 430 Ser Val Phe Leu Asn Val Ser Val Leu Asp Pro Ala Ala Arg Leu Arg 435 440 445 Leu Glu Ala Arg Leu Gly His Leu Val Ala Ala Ile Leu Glu Arg Glu 450 455 460 Gln Ser Leu Val Ala His Ala Leu Gly Tyr Gln Leu Ala Phe Val Leu 465 470 475 480 Asp Ser Pro Ala Ala Tyr Gly Ala Val Ala Pro Ser Ala Ala Arg Leu 485 490 495 Ile Asp Ala Leu Tyr Ala Glu Phe Leu Gly Gly Arg Ala Leu Thr Ala 500 505 510 Pro Met Val Arg Arg Ala Leu Phe Tyr Ala Thr Ala Val Leu Arg Ala 515 520 525 Pro Phe Leu Ala Gly Ala Pro Ser Ala Glu Gln Arg Glu Arg Ala Arg 530 535 540 Arg Gly Leu Leu Ile Thr Thr Ala Leu Cys Thr Ser Asp Val Ala Ala 545 550 555 560 Ala Thr His Ala Asp Leu Arg Ala Ala Leu Ala Arg Thr Asp His Gln 565 570 575 Lys Asn Leu Phe Trp Leu Pro Asp His Phe Ser Pro Cys Ala Ala Ser 580 585 590 Leu Arg Phe Asp Leu Ala Glu Gly Gly Phe Ile Leu Asp Ala Leu Ala 595 600 605 Met Ala Thr Arg Ser Asp Ile Pro Ala Asp Val Met Ala Gln Gln Thr 610 615 620 Arg Gly Val Ala Ser Val Leu Thr Arg Trp Ala His Tyr Asn Ala Leu 625 630 635 640 Ile Arg Ala Phe Val Pro Glu Ala Thr His Gln Cys Ser Gly Pro Ser 645 650 655 His Asn Ala Glu Pro Arg Ile Leu Val Pro Ile Thr His Asn Ala Ser 660 665 670 Tyr Val Val Thr His Thr Pro Leu Pro Arg Gly Ile Gly Tyr Lys Leu 675 680 685 Thr Gly Val Asp Val Arg Arg Pro Leu Phe Ile Thr Tyr Leu Thr Ala 690 695 700 Thr Cys Glu Gly His Ala Arg Glu Ile Glu Pro Lys Arg Leu Val Arg 705 710 715 720 Thr Glu Asn Arg Arg Asp Leu Gly Leu Val Gly Ala Val Phe Leu Arg 725 730 735 Tyr Thr Pro Ala Gly Glu Val Met Ser Val Leu Leu Val Asp Thr Asp 740 745 750 Ala Thr Gln Gln Gln Leu Ala Gln Gly Pro Val Ala Gly Thr Pro Asn 755 760 765 Val Phe Ser Ser Asp Val Pro Ser Val Ala Leu Leu Leu Phe Pro Asn 770 775 780 Gly Thr Val Ile His Leu Leu Ala Phe Asp Thr Leu Pro Ile Ala Thr 785 790 795 800 Ile Ala Pro Gly Phe Leu Ala Ala Ser Ala Leu Gly Val Val Met Ile 805 810 815 Thr Ala Ala Leu Ala Gly Ile Leu Arg Val Val Arg Thr Cys Val Pro 820 825 830 Phe Leu Trp Arg Arg Glu 835 <210> 543 <211> 675 <212> DNA <213> Simplexvirus Herpes simplex virus type 2 <400> 543 atggggttcg tctgtctgtt tgggcttgtc gttatgggag cctggggggc gtggggtggg 60 tcacaggcaa ccgaatatgt tcttcgtagt gttattgcca aagaggtggg ggacatacta 120 agagtgcctt gcatgcggac ccccgcggac gatgtttctt ggcgctacga ggccccgtcc 180 gttattgact atgcccgcat agacggaata tttcttcgct atcactgccc ggggttggac 240 acgtttttgt gggataggca cgcccagagg gcgtatctgg ttaacccctt tctctttgcg 300 gcgggatttt tggaggactt gagtcactct gtgtttccgg ccgacaccca ggaaacaacg 360 acgcgccggg ccctttataa agagatacgc gatgcgttgg gcagtcgaaa acaggccgtc 420 agccacgcac ccgtcagggc cgggtgtgta aactttgact actcacgcac tcgccgctgc 480 gtcgggcgac gcgatttacg gcctgccaac accacgtcaa cgtgggaacc gcctgtgtcg 540 tcggacgatg aagcgagctc gcagtcgaag cccctcgcca cccagccgcc cgtcctcgcc 600 ctttcgaacg cccccccacg gcgggtctcc ccgacgcgag gtcggcgccg gcatactcgc 660 ctccgacgca actag 675 <210> 544 <211> 224 <212> PRT <213> Simplexvirus Herpes simplex virus type 2 <400> 544 Met Gly Phe Val Cys Leu Phe Gly Leu Val Val Met Gly Ala Trp Gly 1 5 10 15 Ala Trp Gly Gly Ser Gln Ala Thr Glu Tyr Val Leu Arg Ser Val Ile 20 25 30 Ala Lys Glu Val Gly Asp Ile Leu Arg Val Pro Cys Met Arg Thr Pro 35 40 45 Ala Asp Asp Val Ser Trp Arg Tyr Glu Ala Pro Ser Val Ile Asp Tyr 50 55 60 Ala Arg Ile Asp Gly Ile Phe Leu Arg Tyr His Cys Pro Gly Leu Asp 65 70 75 80 Thr Phe Leu Trp Asp Arg His Ala Gln Arg Ala Tyr Leu Val Asn Pro 85 90 95 Phe Leu Phe Ala Ala Gly Phe Leu Glu Asp Leu Ser His Ser Val Phe 100 105 110 Pro Ala Asp Thr Gln Glu Thr Thr Thr Arg Arg Ala Leu Tyr Lys Glu 115 120 125 Ile Arg Asp Ala Leu Gly Ser Arg Lys Gln Ala Val Ser His Ala Pro 130 135 140 Val Arg Ala Gly Cys Val Asn Phe Asp Tyr Ser Arg Thr Arg Arg Cys 145 150 155 160 Val Gly Arg Arg Asp Leu Arg Pro Ala Asn Thr Thr Ser Thr Trp Glu 165 170 175 Pro Pro Val Ser Ser Asp Asp Glu Ala Ser Ser Gln Ser Lys Pro Leu 180 185 190 Ala Thr Gln Pro Pro Val Leu Ala Leu Ser Asn Ala Pro Pro Arg Arg 195 200 205 Val Ser Pro Thr Arg Gly Arg Arg Arg His Thr Arg Leu Arg Arg Asn 210 215 220 <210> 545 <211> 2607 <212> DNA <213> Varicellovirus Varicella virus <400> 545 atgtttgtta cggcggttgt gtcggtctct ccaagctcgt tttatgagag tttacaagta 60 gagcccacac aatcagaaga tataacccgg tctgctcatc tgggcgatgg tgatgaaatc 120 agagaagcta tacacaagtc ccaggacgcc gaaacaaaac ccacgtttta cgtctgccca 180 ccgccaacag gctccacaat cgtacgatta gaaccaactc ggacatgtcc ggattatcac 240 cttggtaaaa actttacaga gggtattgct gttgtttata aagaaaacat tgcagcgtac 300 aagtttaagg cgacggtata ttacaaagat gttatcgtta gcacggcgtg ggccggaagt 360 tcttatacgc aaattactaa tagatatgcg gatagggtac caattcccgt ttcagagatc 420 acggacacca ttgataagtt tggcaagtgt tcttctaaag caacgtacgt acgaaataac 480 cacaaagttg aagcctttaa tgaggataaa aatccacagg atatgcctct aatcgcatca 540 aaatataatt ctgtgggatc caaagcatgg catactacca atgacacgta catggttgcc 600 ggaacccccg gaacatatag gacgggcacg tcggtgaatt gcatcattga ggaagttgaa 660 gccagatcaa tattccctta tgatagtttt ggactttcca cgggagatat aatatacatg 720 tccccgtttt ttggcctacg ggatggtgca tacagagaac attccaatta tgcaatggat 780 cgttttcacc agtttgaggg ttatagacaa agggatcttg acactagagc attactggaa 840 cctgcagcgc ggaacttttt agtcacgcct catttaacgg ttggttggaa ctggaagcca 900 aaacgaacgg aagtttgttc gcttgtcaag tggcgtgagg ttgaagacgt agttcgcgat 960 gagtatgcac acaattttcg ctttacaatg aaaacacttt ctaccacgtt tataagtgaa 1020 acaaacgagt ttaatcttaa ccaaatccat ctcagtcaat gtgtaaagga ggaagcccgg 1080 gctattatta accggatcta tacaaccaga tacaactcat ctcatgttag aaccggggat 1140 atccagacct accttgccag aggggggttt gttgtggtgt ttcaacccct gctgagcaat 1200 tccctcgccc gtctctatct ccaagaattg gtccgtgaaa acactaatca ttcaccacaa 1260 aaacacccga ctcgaaatac cagatcccga cgaagcgtgc cagttgagtt gcgtgccaat 1320 agaacaataa caaccacctc atcggtggaa tttgctatgc tccagtttac atatgaccac 1380 attcaagagc atgttaatga aatgttggca cgtatctcct cgtcgtggtg ccagctacaa 1440 aatcgcgaac gcgccctttg gagcggacta tttccaatta acccaagtgc tttagcgagc 1500 accattttgg atcaacgtgt taaagctcgt attctcggcg acgttatctc cgtttctaat 1560 tgtccagaac tgggatcaga tacacgcatt atacttcaaa actctatgag ggtatctggt 1620 agtactacgc gttgttatag ccgtccttta atttcaatag ttagtttaaa tgggtccggg 1680 acggtggagg gccagcttgg aacagataac gagttaatta tgtccagaga tctgttagaa 1740 ccatgcgtgg ctaatcacaa gcgatatttt ctatttgggc atcactacgt atattatgag 1800 gattatcgtt acgtccgtga aatcgcagtc catgatgtgg gaatgattag cacttacgta 1860 gatttaaact taacacttct taaagataga gagtttatgc cgctgcaagt atatacaaga 1920 gacgagctgc gggatacagg attactagac tacagtgaaa ttcaacgccg aaatcaaatg 1980 cattcgctgc gtttttatga catagacaag gttgtgcaat atgatagcgg aacggccatt 2040 atgcagggca tggctcagtt tttccaggga cttgggaccg cgggccaggc cgttggacat 2100 gtggttcttg gggccacggg agcgctgctt tccaccgtac acggatttac cacgttttta 2160 tctaacccat ttggggcatt ggccgtggga ttattggttt tggcgggact ggtagcggcc 2220 ttttttgcgt accggtacgt gcttaaactt aaaacaagcc cgatgaaggc attatatcca 2280 ctcacaacca aggggttaaa acagttaccg gaaggaatgg atccctttgc cgagaaaccc 2340 aacgctactg ataccccaat agaagaaatt ggcgactcac aaaacactga accgtcggta 2400 aatagcgggt ttgatcccga taaatttcga gaagcccagg aaatgattaa atatatgacg 2460 ttagtatctg cggctgagcg ccaagaatct aaagcccgca aaaaaaataa gactagcgcc 2520 cttttaactt cacgtcttac cggccttgct ttacgaaatc gccgaggata ctcccgtgtt 2580 cgcaccgaga atgtaacggg ggtgtaa 2607 <210> 546 <211> 868 <212> PRT <213> Varicellovirus Varicella virus <400> 546 Met Phe Val Thr Ala Val Val Ser Val Ser Pro Ser Ser Phe Tyr Glu 1 5 10 15 Ser Leu Gln Val Glu Pro Thr Gln Ser Glu Asp Ile Thr Arg Ser Ala 20 25 30 His Leu Gly Asp Gly Asp Glu Ile Arg Glu Ala Ile His Lys Ser Gln 35 40 45 Asp Ala Glu Thr Lys Pro Thr Phe Tyr Val Cys Pro Pro Pro Thr Gly 50 55 60 Ser Thr Ile Val Arg Leu Glu Pro Thr Arg Thr Cys Pro Asp Tyr His 65 70 75 80 Leu Gly Lys Asn Phe Thr Glu Gly Ile Ala Val Val Tyr Lys Glu Asn 85 90 95 Ile Ala Ala Tyr Lys Phe Lys Ala Thr Val Tyr Tyr Lys Asp Val Ile 100 105 110 Val Ser Thr Ala Trp Ala Gly Ser Ser Tyr Thr Gln Ile Thr Asn Arg 115 120 125 Tyr Ala Asp Arg Val Pro Ile Pro Val Ser Glu Ile Thr Asp Thr Ile 130 135 140 Asp Lys Phe Gly Lys Cys Ser Ser Lys Ala Thr Tyr Val Arg Asn Asn 145 150 155 160 His Lys Val Glu Ala Phe Asn Glu Asp Lys Asn Pro Gln Asp Met Pro 165 170 175 Leu Ile Ala Ser Lys Tyr Asn Ser Val Gly Ser Lys Ala Trp His Thr 180 185 190 Thr Asn Asp Thr Tyr Met Val Ala Gly Thr Pro Gly Thr Tyr Arg Thr 195 200 205 Gly Thr Ser Val Asn Cys Ile Ile Glu Glu Val Glu Ala Arg Ser Ile 210 215 220 Phe Pro Tyr Asp Ser Phe Gly Leu Ser Thr Gly Asp Ile Ile Tyr Met 225 230 235 240 Ser Pro Phe Phe Gly Leu Arg Asp Gly Ala Tyr Arg Glu His Ser Asn 245 250 255 Tyr Ala Met Asp Arg Phe His Gln Phe Glu Gly Tyr Arg Gln Arg Asp 260 265 270 Leu Asp Thr Arg Ala Leu Leu Glu Pro Ala Ala Arg Asn Phe Leu Val 275 280 285 Thr Pro His Leu Thr Val Gly Trp Asn Trp Lys Pro Lys Arg Thr Glu 290 295 300 Val Cys Ser Leu Val Lys Trp Arg Glu Val Glu Asp Val Val Arg Asp 305 310 315 320 Glu Tyr Ala His Asn Phe Arg Phe Thr Met Lys Thr Leu Ser Thr Thr 325 330 335 Phe Ile Ser Glu Thr Asn Glu Phe Asn Leu Asn Gln Ile His Leu Ser 340 345 350 Gln Cys Val Lys Glu Glu Ala Arg Ala Ile Ile Asn Arg Ile Tyr Thr 355 360 365 Thr Arg Tyr Asn Ser Ser His Val Arg Thr Gly Asp Ile Gln Thr Tyr 370 375 380 Leu Ala Arg Gly Gly Phe Val Val Val Phe Gln Pro Leu Leu Ser Asn 385 390 395 400 Ser Leu Ala Arg Leu Tyr Leu Gln Glu Leu Val Arg Glu Asn Thr Asn 405 410 415 His Ser Pro Gln Lys His Pro Thr Arg Asn Thr Arg Ser Arg Arg Ser 420 425 430 Val Pro Val Glu Leu Arg Ala Asn Arg Thr Ile Thr Thr Thr Ser Ser 435 440 445 Val Glu Phe Ala Met Leu Gln Phe Thr Tyr Asp His Ile Gln Glu His 450 455 460 Val Asn Glu Met Leu Ala Arg Ile Ser Ser Ser Trp Cys Gln Leu Gln 465 470 475 480 Asn Arg Glu Arg Ala Leu Trp Ser Gly Leu Phe Pro Ile Asn Pro Ser 485 490 495 Ala Leu Ala Ser Thr Ile Leu Asp Gln Arg Val Lys Ala Arg Ile Leu 500 505 510 Gly Asp Val Ile Ser Val Ser Asn Cys Pro Glu Leu Gly Ser Asp Thr 515 520 525 Arg Ile Ile Leu Gln Asn Ser Met Arg Val Ser Gly Ser Thr Thr Arg 530 535 540 Cys Tyr Ser Arg Pro Leu Ile Ser Ile Val Ser Leu Asn Gly Ser Gly 545 550 555 560 Thr Val Glu Gly Gln Leu Gly Thr Asp Asn Glu Leu Ile Met Ser Arg 565 570 575 Asp Leu Leu Glu Pro Cys Val Ala Asn His Lys Arg Tyr Phe Leu Phe 580 585 590 Gly His His Tyr Val Tyr Tyr Glu Asp Tyr Arg Tyr Val Arg Glu Ile 595 600 605 Ala Val His Asp Val Gly Met Ile Ser Thr Tyr Val Asp Leu Asn Leu 610 615 620 Thr Leu Leu Lys Asp Arg Glu Phe Met Pro Leu Gln Val Tyr Thr Arg 625 630 635 640 Asp Glu Leu Arg Asp Thr Gly Leu Leu Asp Tyr Ser Glu Ile Gln Arg 645 650 655 Arg Asn Gln Met His Ser Leu Arg Phe Tyr Asp Ile Asp Lys Val Val 660 665 670 Gln Tyr Asp Ser Gly Thr Ala Ile Met Gln Gly Met Ala Gln Phe Phe 675 680 685 Gln Gly Leu Gly Thr Ala Gly Gln Ala Val Gly His Val Val Leu Gly 690 695 700 Ala Thr Gly Ala Leu Leu Ser Thr Val His Gly Phe Thr Thr Phe Leu 705 710 715 720 Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu Ala Gly 725 730 735 Leu Val Ala Ala Phe Phe Ala Tyr Arg Tyr Val Leu Lys Leu Lys Thr 740 745 750 Ser Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Gly Leu Lys Gln 755 760 765 Leu Pro Glu Gly Met Asp Pro Phe Ala Glu Lys Pro Asn Ala Thr Asp 770 775 780 Thr Pro Ile Glu Glu Ile Gly Asp Ser Gln Asn Thr Glu Pro Ser Val 785 790 795 800 Asn Ser Gly Phe Asp Pro Asp Lys Phe Arg Glu Ala Gln Glu Met Ile 805 810 815 Lys Tyr Met Thr Leu Val Ser Ala Ala Glu Arg Gln Glu Ser Lys Ala 820 825 830 Arg Lys Lys Asn Lys Thr Ser Ala Leu Leu Thr Ser Arg Leu Thr Gly 835 840 845 Leu Ala Leu Arg Asn Arg Arg Gly Tyr Ser Arg Val Arg Thr Glu Asn 850 855 860 Val Thr Gly Val 865 <210> 547 <211> 1023 <212> DNA <213> Varicellovirus Varicella virus <400> 547 atgcaggctt taggaatcaa gacagaacat tttataatta tgtgtctact tagcggacat 60 gctgttttta ccctatggta taccgctcgt gtaaagtttg aacatgagtg tgtgtatgca 120 accacggtga ttaatggtgg accggttgta tgggggtctt ataacaactc tcttatatat 180 gtaacgtttg taaaccactc aacgtttttg gatggcctat ctggatacga ttacagctgc 240 cgggaaaatc tattatcagg agatactatg gtaaaaaccg ctatttctac acctttgcat 300 gacaaaattc gaattgttct gggaacacgt aattgtcacg cttatttttg gtgcgtgcag 360 ctaaaaatga ttttttttgc atggtttgta tatggtatgt atttacaatt tcgacgaata 420 cgtcgtatgt ttgggccatt ccgatcatcc tgtgagttaa tatcccccac atcatattca 480 ctgaattacg taacacgggt tatttcgaac attcttcttg gttacccata tacaaagttg 540 gcaaggttgt tatgtgatgt ttccatgcga cgggatggta tgagtaaagt atttaatgct 600 gaccctataa gttttttata tatgcataaa ggtgttacgt tattgatgct tttggaggtt 660 atcgctcata tatcatctgg atgtattgtg cttttaacgc ttggcgttgc atatacacca 720 tgcgcgttat tataccccac atacattcgg attctggcct gggttgttgt atgcacgctc 780 gctatagtag agcttatatc ttatgttaga ccaaaaccaa ccaaggataa tcatttaaat 840 catatcaata cggggggaat acgtggtata tgcacaacat gttgcgctac agtaatgtcc 900 ggccttgcta taaaatgttt ttatatcgtc atatttgcta tagcagtggt tatttttatg 960 cattacgaac aaagggtgca ggtaagcttg tttggggaaa gtgaaaactc ccagaagcat 1020 taa 1023 <210> 548 <211> 340 <212> PRT <213> Varicellovirus Varicella virus <400> 548 Met Gln Ala Leu Gly Ile Lys Thr Glu His Phe Ile Ile Met Cys Leu 1 5 10 15 Leu Ser Gly His Ala Val Phe Thr Leu Trp Tyr Thr Ala Arg Val Lys 20 25 30 Phe Glu His Glu Cys Val Tyr Ala Thr Thr Val Ile Asn Gly Gly Pro 35 40 45 Val Val Trp Gly Ser Tyr Asn Asn Ser Leu Ile Tyr Val Thr Phe Val 50 55 60 Asn His Ser Thr Phe Leu Asp Gly Leu Ser Gly Tyr Asp Tyr Ser Cys 65 70 75 80 Arg Glu Asn Leu Leu Ser Gly Asp Thr Met Val Lys Thr Ala Ile Ser 85 90 95 Thr Pro Leu His Asp Lys Ile Arg Ile Val Leu Gly Thr Arg Asn Cys 100 105 110 His Ala Tyr Phe Trp Cys Val Gln Leu Lys Met Ile Phe Phe Ala Trp 115 120 125 Phe Val Tyr Gly Met Tyr Leu Gln Phe Arg Arg Ile Arg Arg Met Phe 130 135 140 Gly Pro Phe Arg Ser Ser Cys Glu Leu Ile Ser Pro Thr Ser Tyr Ser 145 150 155 160 Leu Asn Tyr Val Thr Arg Val Ile Ser Asn Ile Leu Leu Gly Tyr Pro 165 170 175 Tyr Thr Lys Leu Ala Arg Leu Leu Cys Asp Val Ser Met Arg Arg Asp 180 185 190 Gly Met Ser Lys Val Phe Asn Ala Asp Pro Ile Ser Phe Leu Tyr Met 195 200 205 His Lys Gly Val Thr Leu Leu Met Leu Leu Glu Val Ile Ala His Ile 210 215 220 Ser Ser Gly Cys Ile Val Leu Leu Thr Leu Gly Val Ala Tyr Thr Pro 225 230 235 240 Cys Ala Leu Leu Tyr Pro Thr Tyr Ile Arg Ile Leu Ala Trp Val Val 245 250 255 Val Cys Thr Leu Ala Ile Val Glu Leu Ile Ser Tyr Val Arg Pro Lys 260 265 270 Pro Thr Lys Asp Asn His Leu Asn His Ile Asn Thr Gly Gly Ile Arg 275 280 285 Gly Ile Cys Thr Thr Cys Cys Ala Thr Val Met Ser Gly Leu Ala Ile 290 295 300 Lys Cys Phe Tyr Ile Val Ile Phe Ala Ile Ala Val Val Ile Phe Met 305 310 315 320 His Tyr Glu Gln Arg Val Gln Val Ser Leu Phe Gly Glu Ser Glu Asn 325 330 335 Ser Gln Lys His 340 <210> 549 <211> 2526 <212> DNA <213> Varicellovirus Varicella virus <400> 549 atgtttgcgc tagttttagc ggtggtaatt cttcctcttt ggaccacggc taataaatct 60 tacgtaacac caacccctgc gactcgctct atcggacata tgtctgctct tctacgagaa 120 tattccgacc gtaatatgtc tctgaaatta gaagcctttt atcctactgg tttcgatgaa 180 gaactcatta aatcacttca ctggggaaat gatagaaaac acgttttctt ggttattgtt 240 aaggttaacc ctacaacaca cgaaggagac gtcgggctgg ttatatttcc aaaatacttg 300 ttatcgccat accatttcaa agcagaacat cgagcaccgt ttcctgctgg acgttttgga 360 tttcttagtc accctgtgac acccgacgtg agcttctttg acagttcgtt tgcgccgtat 420 ttaactacgc aacatcttgt tgcgtttact acgttcccac caaaccccct tgtatggcat 480 ttggaaagag ctgagaccgc agcaactgca gaaaggccgt ttggggtaag tcttttaccc 540 gctcgcccaa cagtccccaa gaatactatt ctggaacata aagcgcattt tgctacatgg 600 gatgcccttg cccgacatac ttttttttct gccgaagcaa ttatcaccaa ctcaacgttg 660 agaatacacg ttcccctttt tgggtcggta tggccaattc gatactgggc caccggttcg 720 gtgcttctca caagcgactc gggtcgtgtg gaagtaaata ttggtgtagg atttatgagc 780 tcgctcattt ctttatcctc tggaccaccg atagaattaa ttgttgtacc acatacagta 840 aaactgaacg cggttacaag cgacaccaca tggttccagc taaatccacc gggtccggat 900 ccggggccat cttatcgagt ttatttactt ggacgtgggt tggatatgaa tttttcaaag 960 catgctacgg tcgatatatg cgcatatccc gaagagagtt tggattaccg ctatcattta 1020 tccatggccc acacggaggc tctgcggatg acaacgaagg cggatcaaca tgacataaac 1080 gaggaaagct attaccatat cgccgcaaga atagccacat caatttttgc gttgtcggaa 1140 atgggccgta ccacagaata ttttctgtta gatgagatcg tagatgttca gtatcaatta 1200 aaattcctta attacatttt aatgcggata ggagcaggag ctcatcccaa cactatatcc 1260 ggaacctcgg atctgatctt tgccgatcca tcgcagcttc atgacgaact ttcacttctt 1320 tttggtcagg taaaacccgc aaatgtcgat tattttattt catatgatga agcccgtgat 1380 caactaaaga ccgcatacgc gctttcccgt ggtcaagacc atgtgaatgc actttctctc 1440 gccaggcgtg ttataatgag catatacaag gggctgcttg tgaagcaaaa tttaaatgct 1500 acagagaggc aggctttatt ttttgcctca atgattttat taaatttccg cgaaggacta 1560 gaaaattcat ctcgggtatt agacggtcgc acaactttgc ttttaatgac atccatgtgt 1620 acggcagctc acgccacgca agcagcactt aacatacaag aaggcctggc atacttaaat 1680 ccttcaaaac acatgtttac aataccaaac gtatacagtc cttgtatggg ttcccttcgt 1740 acagacctca cggaagagat tcatgttatg aatctcctgt cggcaatacc aacacgccca 1800 ggacttaacg aggtattgca tacccaacta gacgaatctg aaatattcga cgcggcattt 1860 aaaaccatga tgatttttac cacatggact gccaaagatt tgcatatact ccacacccat 1920 gtaccagaag tatttacgtg tcaagatgca gccgcgcgta acggagaata tgtgctcatt 1980 cttccagctg tccagggaca cagttatgtg attacacgaa acaaacctca aaggggtttg 2040 gtatattccc tggcagatgt ggatgtatat aaccccatat ccgttgttta tttaagcagg 2100 gatacttgcg tgtctgaaca tggtgtcata gagacggtcg cactgcccca tccggacaat 2160 ttaaaagaat gtttgtattg cggaagtgtt tttcttaggt atctaaccac gggggcgatt 2220 atggatataa ttattattga cagcaaagat acagaacgac aactagccgc tatgggaaac 2280 tccacaattc cacccttcaa tccagacatg cacggggatg actctaaggc tgtgttgttg 2340 tttccaaacg gaactgtggt aacgcttcta ggattcgaac gacgacaagc catacgaatg 2400 tcgggacaat accttggggc ctctttagga ggggcgtttc tggcggtagt ggggtttggt 2460 attatcggat ggatgttatg tggaaattcc cgccttcgag aatataataa aatacctctg 2520 acataa 2526 <210> 550 <211> 841 <212> PRT <213> Varicellovirus Varicella virus <400> 550 Met Phe Ala Leu Val Leu Ala Val Val Ile Leu Pro Leu Trp Thr Thr 1 5 10 15 Ala Asn Lys Ser Tyr Val Thr Pro Thr Pro Ala Thr Arg Ser Ile Gly 20 25 30 His Met Ser Ala Leu Leu Arg Glu Tyr Ser Asp Arg Asn Met Ser Leu 35 40 45 Lys Leu Glu Ala Phe Tyr Pro Thr Gly Phe Asp Glu Glu Leu Ile Lys 50 55 60 Ser Leu His Trp Gly Asn Asp Arg Lys His Val Phe Leu Val Ile Val 65 70 75 80 Lys Val Asn Pro Thr Thr His Glu Gly Asp Val Gly Leu Val Ile Phe 85 90 95 Pro Lys Tyr Leu Leu Ser Pro Tyr His Phe Lys Ala Glu His Arg Ala 100 105 110 Pro Phe Pro Ala Gly Arg Phe Gly Phe Leu Ser His Pro Val Thr Pro 115 120 125 Asp Val Ser Phe Phe Asp Ser Ser Phe Ala Pro Tyr Leu Thr Thr Gln 130 135 140 His Leu Val Ala Phe Thr Thr Phe Pro Pro Asn Pro Leu Val Trp His 145 150 155 160 Leu Glu Arg Ala Glu Thr Ala Ala Thr Ala Glu Arg Pro Phe Gly Val 165 170 175 Ser Leu Leu Pro Ala Arg Pro Thr Val Pro Lys Asn Thr Ile Leu Glu 180 185 190 His Lys Ala His Phe Ala Thr Trp Asp Ala Leu Ala Arg His Thr Phe 195 200 205 Phe Ser Ala Glu Ala Ile Ile Thr Asn Ser Thr Leu Arg Ile His Val 210 215 220 Pro Leu Phe Gly Ser Val Trp Pro Ile Arg Tyr Trp Ala Thr Gly Ser 225 230 235 240 Val Leu Leu Thr Ser Asp Ser Gly Arg Val Glu Val Asn Ile Gly Val 245 250 255 Gly Phe Met Ser Ser Leu Ile Ser Leu Ser Ser Gly Pro Pro Ile Glu 260 265 270 Leu Ile Val Val Pro His Thr Val Lys Leu Asn Ala Val Thr Ser Asp 275 280 285 Thr Thr Trp Phe Gln Leu Asn Pro Pro Gly Pro Asp Pro Gly Pro Ser 290 295 300 Tyr Arg Val Tyr Leu Leu Gly Arg Gly Leu Asp Met Asn Phe Ser Lys 305 310 315 320 His Ala Thr Val Asp Ile Cys Ala Tyr Pro Glu Glu Ser Leu Asp Tyr 325 330 335 Arg Tyr His Leu Ser Met Ala His Thr Glu Ala Leu Arg Met Thr Thr 340 345 350 Lys Ala Asp Gln His Asp Ile Asn Glu Glu Ser Tyr Tyr His Ile Ala 355 360 365 Ala Arg Ile Ala Thr Ser Ile Phe Ala Leu Ser Glu Met Gly Arg Thr 370 375 380 Thr Glu Tyr Phe Leu Leu Asp Glu Ile Val Asp Val Gln Tyr Gln Leu 385 390 395 400 Lys Phe Leu Asn Tyr Ile Leu Met Arg Ile Gly Ala Gly Ala His Pro 405 410 415 Asn Thr Ile Ser Gly Thr Ser Asp Leu Ile Phe Ala Asp Pro Ser Gln 420 425 430 Leu His Asp Glu Leu Ser Leu Leu Phe Gly Gln Val Lys Pro Ala Asn 435 440 445 Val Asp Tyr Phe Ile Ser Tyr Asp Glu Ala Arg Asp Gln Leu Lys Thr 450 455 460 Ala Tyr Ala Leu Ser Arg Gly Gln Asp His Val Asn Ala Leu Ser Leu 465 470 475 480 Ala Arg Arg Val Ile Met Ser Ile Tyr Lys Gly Leu Leu Val Lys Gln 485 490 495 Asn Leu Asn Ala Thr Glu Arg Gln Ala Leu Phe Phe Ala Ser Met Ile 500 505 510 Leu Leu Asn Phe Arg Glu Gly Leu Glu Asn Ser Ser Arg Val Leu Asp 515 520 525 Gly Arg Thr Thr Leu Leu Leu Met Thr Ser Met Cys Thr Ala Ala His 530 535 540 Ala Thr Gln Ala Ala Leu Asn Ile Gln Glu Gly Leu Ala Tyr Leu Asn 545 550 555 560 Pro Ser Lys His Met Phe Thr Ile Pro Asn Val Tyr Ser Pro Cys Met 565 570 575 Gly Ser Leu Arg Thr Asp Leu Thr Glu Glu Ile His Val Met Asn Leu 580 585 590 Leu Ser Ala Ile Pro Thr Arg Pro Gly Leu Asn Glu Val Leu His Thr 595 600 605 Gln Leu Asp Glu Ser Glu Ile Phe Asp Ala Ala Phe Lys Thr Met Met 610 615 620 Ile Phe Thr Thr Trp Thr Ala Lys Asp Leu His Ile Leu His Thr His 625 630 635 640 Val Pro Glu Val Phe Thr Cys Gln Asp Ala Ala Ala Arg Asn Gly Glu 645 650 655 Tyr Val Leu Ile Leu Pro Ala Val Gln Gly His Ser Tyr Val Ile Thr 660 665 670 Arg Asn Lys Pro Gln Arg Gly Leu Val Tyr Ser Leu Ala Asp Val Asp 675 680 685 Val Tyr Asn Pro Ile Ser Val Val Tyr Leu Ser Arg Asp Thr Cys Val 690 695 700 Ser Glu His Gly Val Ile Glu Thr Val Ala Leu Pro His Pro Asp Asn 705 710 715 720 Leu Lys Glu Cys Leu Tyr Cys Gly Ser Val Phe Leu Arg Tyr Leu Thr 725 730 735 Thr Gly Ala Ile Met Asp Ile Ile Ile Ile Asp Ser Lys Asp Thr Glu 740 745 750 Arg Gln Leu Ala Ala Met Gly Asn Ser Thr Ile Pro Pro Phe Asn Pro 755 760 765 Asp Met His Gly Asp Asp Ser Lys Ala Val Leu Leu Phe Pro Asn Gly 770 775 780 Thr Val Val Thr Leu Leu Gly Phe Glu Arg Arg Gln Ala Ile Arg Met 785 790 795 800 Ser Gly Gln Tyr Leu Gly Ala Ser Leu Gly Gly Ala Phe Leu Ala Val 805 810 815 Val Gly Phe Gly Ile Ile Gly Trp Met Leu Cys Gly Asn Ser Arg Leu 820 825 830 Arg Glu Tyr Asn Lys Ile Pro Leu Thr 835 840 <210> 551 <211> 483 <212> DNA <213> Varicellovirus Varicella virus <400> 551 atggcatcac ataaatggtt actgcagatg atagtttttt taaaaactat cacaatcgcg 60 tattgtcttc atctccaaga cgacactccg ttgttttttg gagccaaacc gctatcggat 120 gtgagtttga ttataacgga accgtgcgtg tcatcggtat atgaggcgtg ggactatgcg 180 gcacccccgg tatcaaacct cagcgaggcg ctatcgggaa tcgtggttaa gacaaaatgt 240 ccagtaccgg aagttatact ttggtttaaa gacaaacaaa tggcgtactg gacaaatcca 300 tacgtcacct taaaggggct gacacaatct gttggtgaag aacataaaag cggggacata 360 cgcgatgctt tgttggatgc cctttccggt gtatgggtag actctactcc atcttccaca 420 aatatcccgg aaaatggatg tgtctgggga gccgaccgtt tgttccaacg cgtatgccaa 480 tga 483 <210> 552 <211> 160 <212> PRT <213> Varicellovirus Varicella virus <400> 552 Met Ala Ser His Lys Trp Leu Leu Gln Met Ile Val Phe Leu Lys Thr 1 5 10 15 Ile Thr Ile Ala Tyr Cys Leu His Leu Gln Asp Asp Thr Pro Leu Phe 20 25 30 Phe Gly Ala Lys Pro Leu Ser Asp Val Ser Leu Ile Ile Thr Glu Pro 35 40 45 Cys Val Ser Ser Val Tyr Glu Ala Trp Asp Tyr Ala Ala Pro Pro Val 50 55 60 Ser Asn Leu Ser Glu Ala Leu Ser Gly Ile Val Val Lys Thr Lys Cys 65 70 75 80 Pro Val Pro Glu Val Ile Leu Trp Phe Lys Asp Lys Gln Met Ala Tyr 85 90 95 Trp Thr Asn Pro Tyr Val Thr Leu Lys Gly Leu Thr Gln Ser Val Gly 100 105 110 Glu Glu His Lys Ser Gly Asp Ile Arg Asp Ala Leu Leu Asp Ala Leu 115 120 125 Ser Gly Val Trp Val Asp Ser Thr Pro Ser Ser Thr Asn Ile Pro Glu 130 135 140 Asn Gly Cys Val Trp Gly Ala Asp Arg Leu Phe Gln Arg Val Cys Gln 145 150 155 160 <210> 553 <211> 1341 <212> DNA <213> Orthohepadnavirus Hepatitis B virus <400> 553 gccaccatgc agttaatcat tacttccaaa ctaggcatta tttacatact ctgtggaagg 60 ctggcattct atataagaga gaaactacac gcagtgcctc attttgtggg tcaccatatt 120 cttgggaaca agagctacag catgggaggt tggtcttcca aacctcgaca aggcatgggg 180 acgaatcttt ctgttcccaa tcctctggga ttctttcccg atcaccagtt ggaccctgcg 240 ttcggagcca actcaaacaa tccagattgg gacttcaacc ccaacaagga tcactggcca 300 gaggcaaagc aggtaggagc gggagcattc gggccagggt tcaccccacc acacggcggc 360 cttttggggt ggagccctca ggctcagggc acattgacaa cagtgccagc agcgcctcct 420 cctgcttcca ccaatcggca gtcaggaaga cagcctactc ccatctctcc acctctaaga 480 gacagtcatc ctcaggccat gcagtggaac tccacaacat tccaccaagc tctgctagat 540 ccaagagtga ggggcctcta tttccctgct ggtggctcca gttccggaac agtaaaccct 600 gttccgacta ctgcctcacc catatcgtca atcttctcga ggactgggga ccctgcaccg 660 aacatggaga gcacaacatc aggattccta ggacccctgc tcgtgttaca ggcggggttt 720 ttcttgttga caagaatcct cacaatacca cagagtctag actcgtggtt gacttctctc 780 aattttctag ggggaacacc caagtgtcct ggccaaaatt cgcagtcccc aacctccaat 840 cactcaccaa cctcttgtcc tccaacttgt cctggctatc gctggatgtg tctgcggcgt 900 tttatcatat tcctcttcat cctgctgcta tgcctcatct tcttgttggt tcttctggac 960 tacaaaggta tgttgcccgt ttgtcctcta cttccaggaa catcaactac cagcacggga 1020 ccatgcaaga cctgcacgat tcctgctcaa aacacctcta tgtttccctc ttgttgctgt 1080 acaaaacctt cggacggaaa ctgcacttgt attcccatcc catcatcctg ggctttcgca 1140 agattcctat gggagtgggc ctcagtccgt ttctcctggc tcagtttact agtgccattt 1200 gttcagtggt ctgcagggct ttcccccact gtttggcttt cagttatatg gacgatgtgg 1260 tattgggggc caagtctgta caacatcttg agtccctttt tacctctatt accaatttta 1320 tgttgtcttt gggcatacat t 1341 <210> 554 <211> 445 <212> PRT <213> Orthohepadnavirus Hepatitis B virus <400> 554 Met Gln Leu Ile Ile Thr Ser Lys Leu Gly Ile Ile Tyr Ile Leu Cys 1 5 10 15 Gly Arg Leu Ala Phe Tyr Ile Arg Glu Lys Leu His Ala Val Pro His 20 25 30 Phe Val Gly His His Ile Leu Gly Asn Lys Ser Tyr Ser Met Gly Gly 35 40 45 Trp Ser Ser Lys Pro Arg Gln Gly Met Gly Thr Asn Leu Ser Val Pro 50 55 60 Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala Phe Gly 65 70 75 80 Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys Asp His 85 90 95 Trp Pro Glu Ala Lys Gln Val Gly Ala Gly Ala Phe Gly Pro Gly Phe 100 105 110 Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala Gln Gly 115 120 125 Thr Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr Asn Arg 130 135 140 Gln Ser Gly Arg Gln Pro Thr Pro Ile Ser Pro Pro Leu Arg Asp Ser 145 150 155 160 His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln Ala Leu 165 170 175 Leu Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser 180 185 190 Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser 195 200 205 Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Ser Thr Thr 210 215 220 Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu 225 230 235 240 Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Leu Thr 245 250 255 Ser Leu Asn Phe Leu Gly Gly Thr Pro Lys Cys Pro Gly Gln Asn Ser 260 265 270 Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys 275 280 285 Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe 290 295 300 Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Lys 305 310 315 320 Gly Met Leu Pro Val Cys Pro Leu Leu Pro Gly Thr Ser Thr Thr Ser 325 330 335 Thr Gly Pro Cys Lys Thr Cys Thr Ile Pro Ala Gln Asn Thr Ser Met 340 345 350 Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys 355 360 365 Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Arg Phe Leu Trp Glu Trp 370 375 380 Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln 385 390 395 400 Trp Ser Ala Gly Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Thr 405 410 415 Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu 420 425 430 Pro Leu Leu Pro Ile Leu Cys Cys Leu Trp Ala Tyr Ile 435 440 445 <210> 555 <211> 849 <212> DNA <213> Orthohepadnavirus Hepatitis B virus <400> 555 gccaccatgc agtggaactc cacgacgttc catcaggcgt tgcaggatcc tcgcgtgagg 60 ggactctact ttccggccgg gggctcctct agtggcacag tcaatcctgt gcccacaacg 120 gcaagcttga tttcctcaat cttttcacgc atcggcgacc cagcaccgaa catggagtct 180 attacttctg gtttcctggg ccccctcctc gtgttgcaag ccggtttctt cctcctgacc 240 aaaatactca ccatacccca gtctctggat agttggtgga cgagcctgaa tttccttggt 300 ggagctcccg tttgcctcgg tcagaatagc caatcaccca cttccaacca ctcacctacg 360 tcctgtccac ctatctgccc tggataccgc tggatgtgct tgcggcggtt tataattttc 420 ctcttcatcc tccttttatg tctgattttt ctcctggttt tgctggatta ccagggtatg 480 ctgcctgtgt gtcccctcat cccaggaagc agcacgacct ctactggtcc atgccgcacc 540 tgcatgactc tggctcaggg aacttccatg tttccgtcct gttgttgctc caagccttct 600 gatgggaatt gcacttgtat acctatccct agtagttggg ccttcgggaa gttcttgtgg 660 gagtgggcgt cagcccgttt ctcctggctg agcttgttag taccttttgt ccaatggttc 720 gcaggcctgt ctccaacagt gtggttatcc gtgatttgga tgatgtggta ttggggccct 780 agcctctatg atatcctgag tccttttatc cctctgctgc caatcttctt ttgcctttgg 840 gtgtacatc 849 <210> 556 <211> 281 <212> PRT <213> Orthohepadnavirus Hepatitis B virus <400> 556 Met Gln Trp Asn Ser Thr Thr Phe His Gln Ala Leu Gln Asp Pro Arg 1 5 10 15 Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val 20 25 30 Asn Pro Val Pro Thr Thr Ala Ser Leu Ile Ser Ser Ile Phe Ser Arg 35 40 45 Ile Gly Asp Pro Ala Pro Asn Met Glu Ser Ile Thr Ser Gly Phe Leu 50 55 60 Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Lys Ile 65 70 75 80 Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe 85 90 95 Leu Gly Gly Ala Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr 100 105 110 Ser Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg 115 120 125 Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu 130 135 140 Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro 145 150 155 160 Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys 165 170 175 Arg Thr Cys Met Thr Leu Ala Gln Gly Thr Ser Met Phe Pro Ser Cys 180 185 190 Cys Cys Ser Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro 195 200 205 Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala Ser Ala Arg 210 215 220 Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Ala Gly 225 230 235 240 Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp 245 250 255 Gly Pro Ser Leu Tyr Asp Ile Leu Ser Pro Phe Ile Pro Leu Leu Pro 260 265 270 Ile Phe Phe Cys Leu Trp Val Tyr Ile 275 280 <210> 557 <211> 684 <212> DNA <213> Orthohepadnavirus Hepatitis B virus <400> 557 gccaccatgg aaagcattac ttccggcttt ctcggcccgt tactggtgct tcaggctgga 60 ttctttctgc tcaccaaaat ccttacaatt ccacagtctc ttgattcatg gtggactagt 120 ttgaattttc tggggggagc accagtctgc ctgggtcaga actcccagtc tccgacaagt 180 aaccatagcc caaccagttg tcctccgata tgccccggct ataggtggat gtgtcttcgc 240 cgcttcatta ttttcctgtt cattttgctt ctttgcttaa tctttctgct tgtgcttctg 300 gactaccagg gtatgcttcc tgtatgcccg ctgatccctg gttcatcaac cacgtccacc 360 gggccttgcc ggacttgcat gactttggcc caggggactt ctatgttccc aagctgttgc 420 tgttcaaaac cctccgacgg gaactgtacc tgtatcccca ttccttccag ttgggccttt 480 ggaaaattcc tctgggagtg ggcttccgca cggttcagct ggctttcact gcttgttcca 540 tttgtacagt ggtttgccgg gctgtctcct accgtgtggc tcagcgttat atggatgatg 600 tggtattggg gaccatcact ctacgacatt ctgtccccat tcatcccact gttgcctatt 660 ttcttttgct tatgggtata catc 684 <210> 558 <211> 226 <212> PRT <213> Orthohepadnavirus Hepatitis B virus <400> 558 Met Glu Ser Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln 1 5 10 15 Ala Gly Phe Phe Leu Leu Thr Lys Ile Leu Thr Ile Pro Gln Ser Leu 20 25 30 Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ala Pro Val Cys 35 40 45 Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser 50 55 60 Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe 65 70 75 80 Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val 85 90 95 Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly 100 105 110 Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Met Thr Leu Ala 115 120 125 Gln Gly Thr Ser Met Phe Pro Ser Cys Cys Cys Ser Lys Pro Ser Asp 130 135 140 Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys 145 150 155 160 Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu 165 170 175 Val Pro Phe Val Gln Trp Phe Ala Gly Leu Ser Pro Thr Val Trp Leu 180 185 190 Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asp Ile 195 200 205 Leu Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val 210 215 220 Tyr Ile 225 <210> 559 <211> 2949 <212> DNA <213> Alphavirus Eastern equine encephalitis virus <400> 559 atgtcgctcg ccactgtcat gtgcgtcctg gccaatatca cgtttccatg tgatcaacca 60 ccctgcatgc catgctgtta tgaaaagaat ccacacgaaa cactcaccat gctggaacag 120 aattacgaca gccgagccta tgatcagctg ctcgatgccg ctgtgaaatg taatgctagg 180 agaaccagga gagatttgga cactcatttc acccagtata agttggcacg cccgtatatt 240 gctgattgcc ctaactgtgg gcatagtcgg tgcgacagcc ctatagctat agaagaagtc 300 agaggggatg cgcatgcagg agtcatccgc atccagacat cagctatgtt tggtctgaag 360 acggatggag tcgatttggc ctacatgagt ttcatgaacg gcaaaacgca gaaatcaata 420 aagatcgaca acctgcatgt gcgcacctca gccccttgtt ccctcgtgtc gcaccacggc 480 tattacatct tggctcaatg cccaccaggg gacacggtta cagttgggtt tcacgacggg 540 cctaaccgcc atacgtgcac agttgcccat aaggtagaat tcaggccagt gggtagagag 600 aaataccgtc acccacctga acatggagtt gaattaccgt gtaaccgtta cactcacaag 660 cgtgcagacc aaggacacta tgttgagatg catcaaccag ggctagttgc cgaccactct 720 ctccttagca tccacagtgc caaggtgaaa attacggtac cgagcggcgc ccaagtgaaa 780 tactactgca agtgtccaga tgtacgagag ggaattacca gcagcgacca tacaaccacc 840 tgcacggatg tcaaacaatg cagggcttac ctgattgaca acaagaaatg ggtgtacaac 900 tctggaagac tgcctcgagg agagggcgac acttttaaag gaaaacttca tgtgcccttt 960 gtgcctgtta aggccaagtg catcgccacg ctggcaccgg agcctctagt tgagcacaaa 1020 caccgcaccc tgattttaca cctgcacccg gaccacccga ccttgctgac gaccaggtca 1080 cttggaagtg atgcaaatcc aactcgacaa tggattgagc gaccaacaac tgtcaatttc 1140 acagtcaccg gagaagggtt ggagtatacc tggggaaacc atccaccaaa aagagtatgg 1200 gctcaagagt caggagaagg gaacccacat ggatggccgc acgaagtggt agtctattac 1260 tacaacagat acccgctaac cacaattatc gggttatgca cctgtgtggc tatcatcatg 1320 gtctcttgtg tcacatccgt gtggctcctt tgcaggactc gcaatctttg cataaccccg 1380 tataaactag ccccgaacgc tcaagtccca atactcctgg cgttactttg ctgcattaag 1440 ccgacgaggg cagacgacac cttgcaagtg ctgaattatc tgtggaacaa caatcaaaac 1500 tttttctgga tgcagacgct tatcccactt gcagcgctta tcgtatgcat gcgcatgctg 1560 cgttgcttat tttgctgtgg gccggctttt ttacttgtct gcggcgcctt gggcgccgca 1620 gcgtacgaac acacagcagt gatgccgaac aaggtgggga tcccgtataa agctttagtc 1680 gaacgcccag ggtatgcacc cgttcaccta cagatacagc tggttaatac caggataatt 1740 ccatcaacta acctggagta catcacctgc aagtacaaga caaaagtgcc gtctccagta 1800 gtgaaatgct gcggtgccac tcaatgtacc tctaaacccc atcctgacta tcagtgtcag 1860 gtgtttacag gtgtttaccc attcatgtgg ggaggagcct actgcttctg cgacaccgaa 1920 aacacccaga tgagcgaggc gtatgtagag cgctcggaag agtgctctat cgaccacgca 1980 aaagcttata aagtacacac aggcactgtt caggcaatgg tgaacataac ttatgggagc 2040 gtcagctgga gatctgcaga tgtctacgtc aatggtgaaa ctcccgcgaa aataggagat 2100 gccaaactca tcataggtcc actgtcatct gcgtggtccc cattcgataa caaggtggtg 2160 gtttatgggc atgaagtgta taattacgac tttcctgagt acagcaccgg caaagcaggc 2220 tctttcggag acctgcaatc acgcacatca accagcaacg atctgtacgc aaataccaac 2280 ttgaagctac aacgacccca ggctggtatc gtgcacacac ctttcaccca ggcgccctct 2340 ggcttcgaac gatggaaaag ggacaaaggg gcaccgttga acgacgtagc cccgtttggc 2400 tgttcaattg ccctggagcc gctccgtgca gaaaattgtg cagtgggaag catccctata 2460 tctatagata tacccgatgc ggctttcacc agaatatctg aaacaccgac agtctcagac 2520 ctggaatgca aaattacgga gtgtacttat gcctccgatt tcggtggtat agccaccgtt 2580 gcctacaaat ccagtaaagc aggaaactgt ccaattcatt ctccatcggg tgttgcagtt 2640 attaaagaga atgacgtcac ccttgctgag agcggatcat ttacattcca cttctccact 2700 gcaaacatcc atcctgcttt taagctgcag gtctgcacca gtgcagttac ctgcaaagga 2760 gattgcaagc caccgaaaga tcatatcgtc gattatccag cacaacatac cgaatccttt 2820 acgtcggcga tatccgccac cgcgtggtcg tggctaaaag tgctggtagg aggaacatca 2880 gcatttattg ttctggggct tattgctaca gcagtggttg ccctagttct gttcttccat 2940 agacattaa 2949 <210> 560 <211> 982 <212> PRT <213> Alphavirus Eastern equine encephalitis virus <400> 560 Met Ser Leu Ala Thr Val Met Cys Val Leu Ala Asn Ile Thr Phe Pro 1 5 10 15 Cys Asp Gln Pro Pro Cys Met Pro Cys Cys Tyr Glu Lys Asn Pro His 20 25 30 Glu Thr Leu Thr Met Leu Glu Gln Asn Tyr Asp Ser Arg Ala Tyr Asp 35 40 45 Gln Leu Leu Asp Ala Ala Val Lys Cys Asn Ala Arg Arg Thr Arg Arg 50 55 60 Asp Leu Asp Thr His Phe Thr Gln Tyr Lys Leu Ala Arg Pro Tyr Ile 65 70 75 80 Ala Asp Cys Pro Asn Cys Gly His Ser Arg Cys Asp Ser Pro Ile Ala 85 90 95 Ile Glu Glu Val Arg Gly Asp Ala His Ala Gly Val Ile Arg Ile Gln 100 105 110 Thr Ser Ala Met Phe Gly Leu Lys Thr Asp Gly Val Asp Leu Ala Tyr 115 120 125 Met Ser Phe Met Asn Gly Lys Thr Gln Lys Ser Ile Lys Ile Asp Asn 130 135 140 Leu His Val Arg Thr Ser Ala Pro Cys Ser Leu Val Ser His His Gly 145 150 155 160 Tyr Tyr Ile Leu Ala Gln Cys Pro Pro Gly Asp Thr Val Thr Val Gly 165 170 175 Phe His Asp Gly Pro Asn Arg His Thr Cys Thr Val Ala His Lys Val 180 185 190 Glu Phe Arg Pro Val Gly Arg Glu Lys Tyr Arg His Pro Pro Glu His 195 200 205 Gly Val Glu Leu Pro Cys Asn Arg Tyr Thr His Lys Arg Ala Asp Gln 210 215 220 Gly His Tyr Val Glu Met His Gln Pro Gly Leu Val Ala Asp His Ser 225 230 235 240 Leu Leu Ser Ile His Ser Ala Lys Val Lys Ile Thr Val Pro Ser Gly 245 250 255 Ala Gln Val Lys Tyr Tyr Cys Lys Cys Pro Asp Val Arg Glu Gly Ile 260 265 270 Thr Ser Ser Asp His Thr Thr Thr Cys Thr Asp Val Lys Gln Cys Arg 275 280 285 Ala Tyr Leu Ile Asp Asn Lys Lys Trp Val Tyr Asn Ser Gly Arg Leu 290 295 300 Pro Arg Gly Glu Gly Asp Thr Phe Lys Gly Lys Leu His Val Pro Phe 305 310 315 320 Val Pro Val Lys Ala Lys Cys Ile Ala Thr Leu Ala Pro Glu Pro Leu 325 330 335 Val Glu His Lys His Arg Thr Leu Ile Leu His Leu His Pro Asp His 340 345 350 Pro Thr Leu Leu Thr Thr Arg Ser Leu Gly Ser Asp Ala Asn Pro Thr 355 360 365 Arg Gln Trp Ile Glu Arg Pro Thr Thr Val Asn Phe Thr Val Thr Gly 370 375 380 Glu Gly Leu Glu Tyr Thr Trp Gly Asn His Pro Pro Lys Arg Val Trp 385 390 395 400 Ala Gln Glu Ser Gly Glu Gly Asn Pro His Gly Trp Pro His Glu Val 405 410 415 Val Val Tyr Tyr Tyr Asn Arg Tyr Pro Leu Thr Thr Ile Ile Gly Leu 420 425 430 Cys Thr Cys Val Ala Ile Ile Met Val Ser Cys Val Thr Ser Val Trp 435 440 445 Leu Leu Cys Arg Thr Arg Asn Leu Cys Ile Thr Pro Tyr Lys Leu Ala 450 455 460 Pro Asn Ala Gln Val Pro Ile Leu Leu Ala Leu Leu Cys Cys Ile Lys 465 470 475 480 Pro Thr Arg Ala Asp Asp Thr Leu Gln Val Leu Asn Tyr Leu Trp Asn 485 490 495 Asn Asn Gln Asn Phe Phe Trp Met Gln Thr Leu Ile Pro Leu Ala Ala 500 505 510 Leu Ile Val Cys Met Arg Met Leu Arg Cys Leu Phe Cys Cys Gly Pro 515 520 525 Ala Phe Leu Leu Val Cys Gly Ala Leu Gly Ala Ala Ala Tyr Glu His 530 535 540 Thr Ala Val Met Pro Asn Lys Val Gly Ile Pro Tyr Lys Ala Leu Val 545 550 555 560 Glu Arg Pro Gly Tyr Ala Pro Val His Leu Gln Ile Gln Leu Val Asn 565 570 575 Thr Arg Ile Ile Pro Ser Thr Asn Leu Glu Tyr Ile Thr Cys Lys Tyr 580 585 590 Lys Thr Lys Val Pro Ser Pro Val Val Lys Cys Cys Gly Ala Thr Gln 595 600 605 Cys Thr Ser Lys Pro His Pro Asp Tyr Gln Cys Gln Val Phe Thr Gly 610 615 620 Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Thr Glu 625 630 635 640 Asn Thr Gln Met Ser Glu Ala Tyr Val Glu Arg Ser Glu Glu Cys Ser 645 650 655 Ile Asp His Ala Lys Ala Tyr Lys Val His Thr Gly Thr Val Gln Ala 660 665 670 Met Val Asn Ile Thr Tyr Gly Ser Val Ser Trp Arg Ser Ala Asp Val 675 680 685 Tyr Val Asn Gly Glu Thr Pro Ala Lys Ile Gly Asp Ala Lys Leu Ile 690 695 700 Ile Gly Pro Leu Ser Ser Ala Trp Ser Pro Phe Asp Asn Lys Val Val 705 710 715 720 Val Tyr Gly His Glu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Ser Thr 725 730 735 Gly Lys Ala Gly Ser Phe Gly Asp Leu Gln Ser Arg Thr Ser Thr Ser 740 745 750 Asn Asp Leu Tyr Ala Asn Thr Asn Leu Lys Leu Gln Arg Pro Gln Ala 755 760 765 Gly Ile Val His Thr Pro Phe Thr Gln Ala Pro Ser Gly Phe Glu Arg 770 775 780 Trp Lys Arg Asp Lys Gly Ala Pro Leu Asn Asp Val Ala Pro Phe Gly 785 790 795 800 Cys Ser Ile Ala Leu Glu Pro Leu Arg Ala Glu Asn Cys Ala Val Gly 805 810 815 Ser Ile Pro Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Thr Arg Ile 820 825 830 Ser Glu Thr Pro Thr Val Ser Asp Leu Glu Cys Lys Ile Thr Glu Cys 835 840 845 Thr Tyr Ala Ser Asp Phe Gly Gly Ile Ala Thr Val Ala Tyr Lys Ser 850 855 860 Ser Lys Ala Gly Asn Cys Pro Ile His Ser Pro Ser Gly Val Ala Val 865 870 875 880 Ile Lys Glu Asn Asp Val Thr Leu Ala Glu Ser Gly Ser Phe Thr Phe 885 890 895 His Phe Ser Thr Ala Asn Ile His Pro Ala Phe Lys Leu Gln Val Cys 900 905 910 Thr Ser Ala Val Thr Cys Lys Gly Asp Cys Lys Pro Pro Lys Asp His 915 920 925 Ile Val Asp Tyr Pro Ala Gln His Thr Glu Ser Phe Thr Ser Ala Ile 930 935 940 Ser Ala Thr Ala Trp Ser Trp Leu Lys Val Leu Val Gly Gly Thr Ser 945 950 955 960 Ala Phe Ile Val Leu Gly Leu Ile Ala Thr Ala Val Val Ala Leu Val 965 970 975 Leu Phe Phe His Arg His 980 <210> 561 <211> 2946 <212> DNA <213> Alphavirus Venezuelan equine encephalitis virus <400> 561 atgtcactag tgaccactat gtgcctgctc gccaatgtga cgttcccatg tgccgaacca 60 ccaatttgct acgacagaaa accagcagag actttggcca tgctcagcgt taacgttgac 120 aacccgggct acgatgagct actggaagca gctgttaagt gccccggaag aaaaaggaga 180 tctaccaagg agctgtttaa ggagtataag ctaacgcgcc cttacatggc cagatgcatc 240 agatgtgccg ttgggagctg ccatagtcca atagcaattg aggcagtgaa gagcgacggg 300 cacgacggct atgttagact tcagacttcc tcgcagtatg gcctggattc ctctggcaac 360 ttaaagggaa ggactatgcg gtatgatatg cacgggacca ttgaagagat accactacat 420 caagtgtcac tccacacatc tcgcccgtgt cacattgtgg atgggcatgg ttattttctg 480 cttgctaggt gcccggcagg ggactccatc accatggaat ttaagaaagg ttcagtcaca 540 cactcctgct cagtgccgta tgaagtgaaa tttaatcctg taggcagaga actctacact 600 catccaccag aacacggagc agagcaagcg tgccaagtct acgcgcacga tgcacagaac 660 agaggagctt atgtcgagat gcacctcccg ggctcagaag tggacagcag tttgatttcc 720 ttgagcggca gttcagtcac cgtgacacct cctgtcggga ctagcgcctt ggtggaatgc 780 aagtgcggcg gcacaaagat ctccgaaacc atcaacaagg caaaacagtt cagccagtgc 840 acaaagaagg agcagtgcag agcatatcga ctgcagaatg acaagtgggt gtataattct 900 gacaaactgc ccaaagcagc gggagccacc ctaaaaggaa aactacacgt cccgttcttg 960 ctggcagacg gcaaatgcac cgtgcctcta gcaccggaac ctatgataac cttcggtttc 1020 cgatcagtgt cactgaaact gcaccctaag aatcccacat atctgaccac tcgccaactt 1080 gctgatgagc ctcattacac gcacgagctc atatctgaac cagctgttag gaattttacc 1140 gtcactgaaa aggggtggga gtttgtatgg ggaaaccatc cgccgaaaag gttttgggca 1200 caggaaacag cacccggaaa tccacatggg ctgccacatg aggtgataac tcattattac 1260 cacagatacc ctatgtccac catcctgggt ttgtcaattt gcgccgccat tgtaaccgtt 1320 tccgttgcag cgtccacctg gctgttttgc aaatccagag tttcgtgcct aactccttac 1380 cggctaacac ctaacgccag gatgccgctt tgcctggccg tgctttgctg cgcccgcact 1440 gcccgggccg agaccacctg ggagtccttg gatcacctat ggaacaataa ccaacagatg 1500 ttctggattc aattgctgat ccctctggcc gccttgattg tagtgactcg cctgctcaag 1560 tgcgtgtgct gtgtagtgcc ttttttagtc gtggccggcg ccgcaggcgc cggcgcctac 1620 gagcacgcga ccacgatgcc gagccaagcg ggaatctcgt ataacaccat agtcaacaga 1680 gcaggctacg cgccactccc tatcagcata acaccaacaa agatcaagct gatacccaca 1740 gtgaacttgg agtacgtcac ctgccactac aaaacaggaa tggattcacc agccatcaaa 1800 tgctgcggat ctcaggaatg tactccaact aacaggcctg atgaacagtg caaagtcttc 1860 acaggggttt acccgttcat gtggggaggt gcatattgct tttgcgacac tgagaatact 1920 caggtcagca aggcctacgt aatgaaatct gacgactgcc ttgcggatca tgctgaagca 1980 tacaaagcgc acacagcctc agtgcaggcg ttcctcaaca tcacagtggg ggaacactct 2040 attgtgacca ccgtgtatgt gaatggagaa actcctgtga acttcaatgg ggtcaaacta 2100 actgcaggtc cactttccac agcttggaca ccctttgaca gaaaaatcgt gcagtatgcc 2160 ggggagatct ataattacga ttttcctgag tatggggcag gacaaccagg agcatttgga 2220 gacatacaat ccagaacagt ctcaagctca gatctgtatg ccaataccaa cctagtgctg 2280 cagagaccca aagcaggagc gatccatgtg ccatacactc aggcaccatc gggttttgag 2340 caatggaaga aagataaagc tccgtcattg aaattcaccg cccctttcgg atgcgaaata 2400 tatacaaacc ccattcgcgc cgaaaattgt gctgtagggt caattccatt agcctttgac 2460 attcccgacg ccttgttcac cagggtgtca gaaacaccga cactttcagc ggccgaatgc 2520 actcttaacg agtgcgtgta ttcatccgac tttggcggga tcgccacggt caagtattcg 2580 gccagcaagt caggcaagtg cgcagtccat gtgccatcag ggactgctac cctaaaagaa 2640 gcagcagtcg agctaaccga gcaagggtcg gcgaccattc atttctcgac cgcaaatatc 2700 cacccggagt tcaggctcca aatatgcaca tcatatgtca cgtgcaaagg tgattgtcac 2760 cccccgaaag accacattgt gacacacccc cagtatcacg cccaaacatt tacagccgcg 2820 gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcggc cgtaattatt 2880 ataattggct tagtgctggc tactattgtg gccatgtacg tgctgaccaa ccagaaacat 2940 aattga 2946 <210> 562 <211> 981 <212> PRT <213> Alphavirus Venezuelan equine encephalitis virus <400> 562 Met Ser Leu Val Thr Thr Met Cys Leu Leu Ala Asn Val Thr Phe Pro 1 5 10 15 Cys Ala Glu Pro Pro Ile Cys Tyr Asp Arg Lys Pro Ala Glu Thr Leu 20 25 30 Ala Met Leu Ser Val Asn Val Asp Asn Pro Gly Tyr Asp Glu Leu Leu 35 40 45 Glu Ala Ala Val Lys Cys Pro Gly Arg Lys Arg Arg Ser Thr Lys Glu 50 55 60 Leu Phe Lys Glu Tyr Lys Leu Thr Arg Pro Tyr Met Ala Arg Cys Ile 65 70 75 80 Arg Cys Ala Val Gly Ser Cys His Ser Pro Ile Ala Ile Glu Ala Val 85 90 95 Lys Ser Asp Gly His Asp Gly Tyr Val Arg Leu Gln Thr Ser Ser Gln 100 105 110 Tyr Gly Leu Asp Ser Ser Gly Asn Leu Lys Gly Arg Thr Met Arg Tyr 115 120 125 Asp Met His Gly Thr Ile Glu Glu Ile Pro Leu His Gln Val Ser Leu 130 135 140 His Thr Ser Arg Pro Cys His Ile Val Asp Gly His Gly Tyr Phe Leu 145 150 155 160 Leu Ala Arg Cys Pro Ala Gly Asp Ser Ile Thr Met Glu Phe Lys Lys 165 170 175 Gly Ser Val Thr His Ser Cys Ser Val Pro Tyr Glu Val Lys Phe Asn 180 185 190 Pro Val Gly Arg Glu Leu Tyr Thr His Pro Pro Glu His Gly Ala Glu 195 200 205 Gln Ala Cys Gln Val Tyr Ala His Asp Ala Gln Asn Arg Gly Ala Tyr 210 215 220 Val Glu Met His Leu Pro Gly Ser Glu Val Asp Ser Ser Leu Ile Ser 225 230 235 240 Leu Ser Gly Ser Ser Val Thr Val Thr Pro Pro Val Gly Thr Ser Ala 245 250 255 Leu Val Glu Cys Lys Cys Gly Gly Thr Lys Ile Ser Glu Thr Ile Asn 260 265 270 Lys Ala Lys Gln Phe Ser Gln Cys Thr Lys Lys Glu Gln Cys Arg Ala 275 280 285 Tyr Arg Leu Gln Asn Asp Lys Trp Val Tyr Asn Ser Asp Lys Leu Pro 290 295 300 Lys Ala Ala Gly Ala Thr Leu Lys Gly Lys Leu His Val Pro Phe Leu 305 310 315 320 Leu Ala Asp Gly Lys Cys Thr Val Pro Leu Ala Pro Glu Pro Met Ile 325 330 335 Thr Phe Gly Phe Arg Ser Val Ser Leu Lys Leu His Pro Lys Asn Pro 340 345 350 Thr Tyr Leu Thr Thr Arg Gln Leu Ala Asp Glu Pro His Tyr Thr His 355 360 365 Glu Leu Ile Ser Glu Pro Ala Val Arg Asn Phe Thr Val Thr Glu Lys 370 375 380 Gly Trp Glu Phe Val Trp Gly Asn His Pro Pro Lys Arg Phe Trp Ala 385 390 395 400 Gln Glu Thr Ala Pro Gly Asn Pro His Gly Leu Pro His Glu Val Ile 405 410 415 Thr His Tyr Tyr His Arg Tyr Pro Met Ser Thr Ile Leu Gly Leu Ser 420 425 430 Ile Cys Ala Ala Ile Val Thr Val Ser Val Ala Ala Ser Thr Trp Leu 435 440 445 Phe Cys Lys Ser Arg Val Ser Cys Leu Thr Pro Tyr Arg Leu Thr Pro 450 455 460 Asn Ala Arg Met Pro Leu Cys Leu Ala Val Leu Cys Cys Ala Arg Thr 465 470 475 480 Ala Arg Ala Glu Thr Thr Trp Glu Ser Leu Asp His Leu Trp Asn Asn 485 490 495 Asn Gln Gln Met Phe Trp Ile Gln Leu Leu Ile Pro Leu Ala Ala Leu 500 505 510 Ile Val Val Thr Arg Leu Leu Lys Cys Val Cys Cys Val Val Pro Phe 515 520 525 Leu Val Val Ala Gly Ala Ala Gly Ala Gly Ala Tyr Glu His Ala Thr 530 535 540 Thr Met Pro Ser Gln Ala Gly Ile Ser Tyr Asn Thr Ile Val Asn Arg 545 550 555 560 Ala Gly Tyr Ala Pro Leu Pro Ile Ser Ile Thr Pro Thr Lys Ile Lys 565 570 575 Leu Ile Pro Thr Val Asn Leu Glu Tyr Val Thr Cys His Tyr Lys Thr 580 585 590 Gly Met Asp Ser Pro Ala Ile Lys Cys Cys Gly Ser Gln Glu Cys Thr 595 600 605 Pro Thr Asn Arg Pro Asp Glu Gln Cys Lys Val Phe Thr Gly Val Tyr 610 615 620 Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Thr Glu Asn Thr 625 630 635 640 Gln Val Ser Lys Ala Tyr Val Met Lys Ser Asp Asp Cys Leu Ala Asp 645 650 655 His Ala Glu Ala Tyr Lys Ala His Thr Ala Ser Val Gln Ala Phe Leu 660 665 670 Asn Ile Thr Val Gly Glu His Ser Ile Val Thr Thr Val Tyr Val Asn 675 680 685 Gly Glu Thr Pro Val Asn Phe Asn Gly Val Lys Leu Thr Ala Gly Pro 690 695 700 Leu Ser Thr Ala Trp Thr Pro Phe Asp Arg Lys Ile Val Gln Tyr Ala 705 710 715 720 Gly Glu Ile Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Gly Gln Pro 725 730 735 Gly Ala Phe Gly Asp Ile Gln Ser Arg Thr Val Ser Ser Ser Asp Leu 740 745 750 Tyr Ala Asn Thr Asn Leu Val Leu Gln Arg Pro Lys Ala Gly Ala Ile 755 760 765 His Val Pro Tyr Thr Gln Ala Pro Ser Gly Phe Glu Gln Trp Lys Lys 770 775 780 Asp Lys Ala Pro Ser Leu Lys Phe Thr Ala Pro Phe Gly Cys Glu Ile 785 790 795 800 Tyr Thr Asn Pro Ile Arg Ala Glu Asn Cys Ala Val Gly Ser Ile Pro 805 810 815 Leu Ala Phe Asp Ile Pro Asp Ala Leu Phe Thr Arg Val Ser Glu Thr 820 825 830 Pro Thr Leu Ser Ala Ala Glu Cys Thr Leu Asn Glu Cys Val Tyr Ser 835 840 845 Ser Asp Phe Gly Gly Ile Ala Thr Val Lys Tyr Ser Ala Ser Lys Ser 850 855 860 Gly Lys Cys Ala Val His Val Pro Ser Gly Thr Ala Thr Leu Lys Glu 865 870 875 880 Ala Ala Val Glu Leu Thr Glu Gln Gly Ser Ala Thr Ile His Phe Ser 885 890 895 Thr Ala Asn Ile His Pro Glu Phe Arg Leu Gln Ile Cys Thr Ser Tyr 900 905 910 Val Thr Cys Lys Gly Asp Cys His Pro Pro Lys Asp His Ile Val Thr 915 920 925 His Pro Gln Tyr His Ala Gln Thr Phe Thr Ala Ala Val Ser Lys Thr 930 935 940 Ala Trp Thr Trp Leu Thr Ser Leu Leu Gly Gly Ser Ala Val Ile Ile 945 950 955 960 Ile Ile Gly Leu Val Leu Ala Thr Ile Val Ala Met Tyr Val Leu Thr 965 970 975 Asn Gln Lys His Asn 980 <210> 563 <211> 2937 <212> DNA <213> Alphavirus Western equine encephalitis virus <400> 563 atgtcactag ttacagcact gtgcgtgctt tcgaatgtta cgttcccatg cgataaacca 60 cccgtgtgct attcactggc gccagaacga acactcgacg tgctcgagga gaacgtcaac 120 aatccaaatt acgacacgct gctggagaac gtcttgaaat gtccgtcacg ccggcccaaa 180 cgaagcatta ccgatgactt cacactgacc agtccctacc tagggttctg cccgtattgc 240 agacactcag cgccgtgttt cagcccaata aaaattgaga acgtgtggga cgaatctgat 300 gatggatcga ttagaatcca ggtctcggca caattcggct atgatcaggc aggcactgca 360 gatgtcacca aattccgtta catgtcttac gaccacgacc atgacatcaa ggaagacagt 420 gtgaagaaaa tagctattag tacatctgga ccctgccgtc gtcttggcca caaagggtac 480 ttcctgttag ctcaatgtcc tccaggtgac agtgtaaccg tcagtatcac gagcggagca 540 tctgagaatt catgcaccgt ggagaaaaag atcaggagga agtttgtcgg tagagaggag 600 tacttgttcc cacctgtcca tggaaagctg gtaaagtgcc acgtttacga tcacttgaag 660 gagacgtctg ccggatacat aaccatgcac aggccaggcc cacacgcgta taagtcctat 720 ctggaggaag cgtcaggcga agtgtacatt aaaccacctt ctggcaagaa cgtcacctac 780 gaatgtaagt gtggcgacta cagcacaggt attgtgagca cgcgaacgaa gatgaacggc 840 tgcaccaaag caaaacagtg cattgcctac aagagcgacc aaacgaaatg ggtctacaac 900 tcgccggatc ttattaggca cacagaccac tcagtgcaag gtaaactgca cattccattc 960 cgcttgacac cgacattctg cccggttccg ttagctcaca cgcctacagt cacgaagtgg 1020 tttaaaggca tcaccctcca cctgactgca acgcgaccaa cattgctgac aacgagaaaa 1080 ttggggctgc gagcagacgc aacagcagaa tggattacag ggactacatc caggaatttt 1140 tctgtggggc gagaagggct ggagtacgta tggggcaacc atgaaccagt cagagtctgg 1200 gcccaggagt cggcaccagg cgacccgcat ggatggccgc atgagatcat catccactat 1260 tatcatcggc atccagtcta cactgtcatt gtgctgtgcg gtgtcgctct tgctatcctg 1320 gtaggcattg catcgtcagc agcttgtatc gccaaagcaa gaagagactg cctgacgcca 1380 tacgcgcttg caccgaacgc aacggtaccc acagcattag cagttttgtg ctgtattcgg 1440 ccaaccaacg cagaaacatt tggagaaact ttgaatcatc tgtggtttaa caaccaaccg 1500 tttctctggg cacagttgtg catccctctg gcagcgctta ttattctgtt tcgctgcttt 1560 tcatgctgca tgcctttttt attggttgca ggcgtctgcc tggggaaggt agacgccttc 1620 gaacatgcga ccactgtgcc aaatgttccg gggatcccgt ataaggcgtt ggtcgaacgt 1680 gcaggttacg cgccacttaa tctggagatt acggtcgtct catcggaatt aacaccctca 1740 actaacaagg agtatgtgac ctgcaaattc cacacagtca ttccttcacc gcaagttaaa 1800 tgctgcgggt ccctcgagtg taaggcatcc tcaaaagcgg attacacatg ccgcgttttt 1860 ggcggtgtgt accctttcat gtggggaggc gcacagtgct tctgtgacag tgagaacaca 1920 caactgagtg aggcatacgt cgagttcgct ccagactgca ctatagatca tgcagtcgca 1980 ctaaaagttc acacagctgc tctgaaagtc ggcctgcgta tagtatacgg caataccacc 2040 gcgcacctgg atacgttcgt caatggcgtc acgccaggtt cctcacggga cctgaaggtc 2100 atagcagggc cgatatcagc cgctttttca ccctttgacc ataaggtcgt catcagaaag 2160 gggcttgttt ataactacga cttccctgag tatggagcta tgaaaccagg agcgttcggc 2220 gatattcaag catcctcgct tgatgccaca gacatagtag cccgcactga catacggctg 2280 ctgaagcctt ctgtcaagaa catccacgtc ccctacaccc aagcagtatc agggtatgaa 2340 atgtggaaga acaactcagg acgacccctg caagaaacag caccatttgg atgtaaaatt 2400 gaagtggagc ctctgcgagc gtctaattgt gcttatgggc acatccctat ctcgattgac 2460 atccctgatg cagcttttgt gagatcatca gaatcaccaa caattttaga agtcagctgc 2520 acagtagcag actgcattta ttctgcagac tttggtggtt cgctaacact acagtacaaa 2580 gctgacaggg agggacattg tccagttcac tcccactcca ctacagctgt tttgaaggaa 2640 gcgaccacac atgtgactgc cacaggcagc ataacactac attttagcac atcgagccca 2700 caagcaaatt tcatagtttc gctatgcggc aagaagacca cttgcaatgc tgaatgtaaa 2760 ccaccggccg accacataat tggagaacca cataaggtcg accaagaatt ccaggcggca 2820 gtttccaaaa catcttggaa ctggctgctt gcactgtttg ggggagcatc atccctcatt 2880 gctgtaggac ttatagtgtt ggtctgcagc tctatgctta taaacacacg tagatga 2937 <210> 564 <211> 978 <212> PRT <213> Alphavirus Western equine encephalitis virus <400> 564 Met Ser Leu Val Thr Ala Leu Cys Val Leu Ser Asn Val Thr Phe Pro 1 5 10 15 Cys Asp Lys Pro Pro Val Cys Tyr Ser Leu Ala Pro Glu Arg Thr Leu 20 25 30 Asp Val Leu Glu Glu Asn Val Asn Asn Pro Asn Tyr Asp Thr Leu Leu 35 40 45 Glu Asn Val Leu Lys Cys Pro Ser Arg Arg Pro Lys Arg Ser Ile Thr 50 55 60 Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly Phe Cys Pro Tyr Cys 65 70 75 80 Arg His Ser Ala Pro Cys Phe Ser Pro Ile Lys Ile Glu Asn Val Trp 85 90 95 Asp Glu Ser Asp Asp Gly Ser Ile Arg Ile Gln Val Ser Ala Gln Phe 100 105 110 Gly Tyr Asp Gln Ala Gly Thr Ala Asp Val Thr Lys Phe Arg Tyr Met 115 120 125 Ser Tyr Asp His Asp His Asp Ile Lys Glu Asp Ser Val Lys Lys Ile 130 135 140 Ala Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu Gly His Lys Gly Tyr 145 150 155 160 Phe Leu Leu Ala Gln Cys Pro Pro Gly Asp Ser Val Thr Val Ser Ile 165 170 175 Thr Ser Gly Ala Ser Glu Asn Ser Cys Thr Val Glu Lys Lys Ile Arg 180 185 190 Arg Lys Phe Val Gly Arg Glu Glu Tyr Leu Phe Pro Pro Val His Gly 195 200 205 Lys Leu Val Lys Cys His Val Tyr Asp His Leu Lys Glu Thr Ser Ala 210 215 220 Gly Tyr Ile Thr Met His Arg Pro Gly Pro His Ala Tyr Lys Ser Tyr 225 230 235 240 Leu Glu Glu Ala Ser Gly Glu Val Tyr Ile Lys Pro Pro Ser Gly Lys 245 250 255 Asn Val Thr Tyr Glu Cys Lys Cys Gly Asp Tyr Ser Thr Gly Ile Val 260 265 270 Ser Thr Arg Thr Lys Met Asn Gly Cys Thr Lys Ala Lys Gln Cys Ile 275 280 285 Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Tyr Asn Ser Pro Asp Leu 290 295 300 Ile Arg His Thr Asp His Ser Val Gln Gly Lys Leu His Ile Pro Phe 305 310 315 320 Arg Leu Thr Pro Thr Phe Cys Pro Val Pro Leu Ala His Thr Pro Thr 325 330 335 Val Thr Lys Trp Phe Lys Gly Ile Thr Leu His Leu Thr Ala Thr Arg 340 345 350 Pro Thr Leu Leu Thr Thr Arg Lys Leu Gly Leu Arg Ala Asp Ala Thr 355 360 365 Ala Glu Trp Ile Thr Gly Thr Thr Ser Arg Asn Phe Ser Val Gly Arg 370 375 380 Glu Gly Leu Glu Tyr Val Trp Gly Asn His Glu Pro Val Arg Val Trp 385 390 395 400 Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly Trp Pro His Glu Ile 405 410 415 Ile Ile His Tyr Tyr His Arg His Pro Val Tyr Thr Val Ile Val Leu 420 425 430 Cys Gly Val Ala Leu Ala Ile Leu Val Gly Ile Ala Ser Ser Ala Ala 435 440 445 Cys Ile Ala Lys Ala Arg Arg Asp Cys Leu Thr Pro Tyr Ala Leu Ala 450 455 460 Pro Asn Ala Thr Val Pro Thr Ala Leu Ala Val Leu Cys Cys Ile Arg 465 470 475 480 Pro Thr Asn Ala Glu Thr Phe Gly Glu Thr Leu Asn His Leu Trp Phe 485 490 495 Asn Asn Gln Pro Phe Leu Trp Ala Gln Leu Cys Ile Pro Leu Ala Ala 500 505 510 Leu Ile Ile Leu Phe Arg Cys Phe Ser Cys Cys Met Pro Phe Leu Leu 515 520 525 Val Ala Gly Val Cys Leu Gly Lys Val Asp Ala Phe Glu His Ala Thr 530 535 540 Thr Val Pro Asn Val Pro Gly Ile Pro Tyr Lys Ala Leu Val Glu Arg 545 550 555 560 Ala Gly Tyr Ala Pro Leu Asn Leu Glu Ile Thr Val Val Ser Ser Glu 565 570 575 Leu Thr Pro Ser Thr Asn Lys Glu Tyr Val Thr Cys Lys Phe His Thr 580 585 590 Val Ile Pro Ser Pro Gln Val Lys Cys Cys Gly Ser Leu Glu Cys Lys 595 600 605 Ala Ser Ser Lys Ala Asp Tyr Thr Cys Arg Val Phe Gly Gly Val Tyr 610 615 620 Pro Phe Met Trp Gly Gly Ala Gln Cys Phe Cys Asp Ser Glu Asn Thr 625 630 635 640 Gln Leu Ser Glu Ala Tyr Val Glu Phe Ala Pro Asp Cys Thr Ile Asp 645 650 655 His Ala Val Ala Leu Lys Val His Thr Ala Ala Leu Lys Val Gly Leu 660 665 670 Arg Ile Val Tyr Gly Asn Thr Thr Ala His Leu Asp Thr Phe Val Asn 675 680 685 Gly Val Thr Pro Gly Ser Ser Arg Asp Leu Lys Val Ile Ala Gly Pro 690 695 700 Ile Ser Ala Ala Phe Ser Pro Phe Asp His Lys Val Val Ile Arg Lys 705 710 715 720 Gly Leu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Met Lys Pro 725 730 735 Gly Ala Phe Gly Asp Ile Gln Ala Ser Ser Leu Asp Ala Thr Asp Ile 740 745 750 Val Ala Arg Thr Asp Ile Arg Leu Leu Lys Pro Ser Val Lys Asn Ile 755 760 765 His Val Pro Tyr Thr Gln Ala Val Ser Gly Tyr Glu Met Trp Lys Asn 770 775 780 Asn Ser Gly Arg Pro Leu Gln Glu Thr Ala Pro Phe Gly Cys Lys Ile 785 790 795 800 Glu Val Glu Pro Leu Arg Ala Ser Asn Cys Ala Tyr Gly His Ile Pro 805 810 815 Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Val Arg Ser Ser Glu Ser 820 825 830 Pro Thr Ile Leu Glu Val Ser Cys Thr Val Ala Asp Cys Ile Tyr Ser 835 840 845 Ala Asp Phe Gly Gly Ser Leu Thr Leu Gln Tyr Lys Ala Asp Arg Glu 850 855 860 Gly His Cys Pro Val His Ser His Ser Thr Thr Ala Val Leu Lys Glu 865 870 875 880 Ala Thr Thr His Val Thr Ala Thr Gly Ser Ile Thr Leu His Phe Ser 885 890 895 Thr Ser Ser Pro Gln Ala Asn Phe Ile Val Ser Leu Cys Gly Lys Lys 900 905 910 Thr Thr Cys Asn Ala Glu Cys Lys Pro Pro Ala Asp His Ile Ile Gly 915 920 925 Glu Pro His Lys Val Asp Gln Glu Phe Gln Ala Ala Val Ser Lys Thr 930 935 940 Ser Trp Asn Trp Leu Leu Ala Leu Phe Gly Gly Ala Ser Ser Leu Ile 945 950 955 960 Ala Val Gly Leu Ile Val Leu Val Cys Ser Ser Met Leu Ile Asn Thr 965 970 975 Arg Arg <210> 565 <211> 2964 <212> DNA <213> Alphavirus Semliki Forest virus <400> 565 atgtccgccc cgctgattac tgccatgtgt gtccttgcca atgctacctt cccgtgcttc 60 cagcccccgt gtgtaccttg ctgctatgaa aacaacgcag aggccacact acggatgctc 120 gaggataacg tggataggcc agggtactac gacctccttc aggcagcctt gacgtgccga 180 aacggaacaa gacaccggcg cagcgtgtcg caacacttca acgtgtataa ggctacacgc 240 ccttacatcg cgtactgcgc cgactgcgga gcagggcact cgtgtcatag ccccgtagca 300 attgaagcgg tcaggtccga agctaccgac gggatgctga agattcagtt ctcggcacaa 360 attggcatag ataagagtga caatcatgac tacacgaaga taaggtacgc agacgggcac 420 gccattgaga atgccgtccg gtcatctttg aaggtagcca cctccggaga ctgtttcgtc 480 catggcacaa tgggacattt catactggca aagtgcccac cgggtgaatt cctgcaggtc 540 tcgatccagg acaccagaaa cgcggtccgt gcctgcagaa tacaatatca tcatgaccct 600 caaccggtgg gtagagaaaa atttacaatt agaccacact atggaaaaga gatcccttgc 660 accacttatc aacagaccac agcggagacc gtggaggaaa tcgacatgca tatgccgcca 720 gatacgccgg acaggacgtt gctatcacag caatctggca atgtaaagat cacagtcgga 780 ggaaagaagg tgaaatacaa ctgcacctgt ggaaccggaa acgttggcac tactaattcg 840 gacatgacga tcaacacgtg tctaatagag cagtgccacg tctcagtgac ggaccataag 900 aaatggcagt tcaactcacc tttcgtcccg agagccgacg aaccggctag aaaaggcaaa 960 gtccatatcc cattcccgtt ggacaacatc acatgcagag ttccaatggc gcgcgaacca 1020 accgtcatcc acggcaaaag agaagtgaca ctgcaccttc acccagatca tcccacgctc 1080 ttttcctacc gcacactggg tgaggacccg cagtatcacg aggaatgggt gacagcggcg 1140 gtggaacgga ccatacccgt accagtggac gggatggagt accactgggg aaacaacgac 1200 ccagtgaggc tttggtctca actcaccact gaagggaaac cgcacggctg gccgcatcag 1260 atcgtacagt actactatgg gctttacccg gccgctacag tatccgcggt cgtcgggatg 1320 agcttactgg cgttgatatc gatcttcgcg tcgtgctaca tgctggttgc ggcccgcagt 1380 aagtgcttga ccccttatgc tttaacacca ggagctgcag ttccgtggac gctggggata 1440 ctctgctgcg ccccgcgggc gcacgcagct agtgtggcag agactatggc ctacttgtgg 1500 gaccaaaacc aagcgttgtt ctggttggag tttgcggccc ctgttgcctg catcctcatc 1560 atcacgtatt gcctcagaaa cgtgctgtgt tgctgtaaga gcctttcttt tttagtgcta 1620 ctgagcctcg gggcaaccgc cagagcttac gaacattcga cagtaatgcc gaacgtggtg 1680 gggttcccgt ataaggctca cattgaaagg ccaggatata gccccctcac tttgcagatg 1740 caggttgttg aaaccagcct cgaaccaacc cttaatttgg aatacataac ctgtgagtac 1800 aagacggtcg tcccgtcgcc gtacgtgaag tgctgcggcg cctcagagtg ctccactaaa 1860 gagaagcctg actaccaatg caaggtttac acaggcgtgt acccgttcat gtggggaggg 1920 gcatattgct tctgcgactc agaaaacacg caactcagcg aggcgtacgt cgatcgatcg 1980 gacgtatgca ggcatgatca cgcatctgct tacaaagccc atacagcatc gctgaaggcc 2040 aaagtgaggg ttatgtacgg caacgtaaac cagactgtgg atgtttacgt gaacggagac 2100 catgccgtca cgataggggg tactcagttc atattcgggc cgctgtcatc ggcctggacc 2160 ccgttcgaca acaagatagt cgtgtacaaa gacgaagtgt tcaatcagga cttcccgccg 2220 tacggatctg ggcaaccagg gcgcttcggc gacatccaaa gcagaacagt ggagagtaac 2280 gacctgtacg cgaacacggc actgaagctg gcacgccctt cacccggcat ggtccatgta 2340 ccgtacacac agacaccttc agggttcaaa tattggctaa aggaaaaagg gacagcccta 2400 aatacgaagg ctccttttgg ctgccaaatc aaaacgaacc ctgtcagggc catgaactgc 2460 gccgtgggaa acatccctgt ctccatgaat ttgcctgaca gcgcctttac ccgcattgtc 2520 gaggcgccga ccatcattga cctgacttgc acagtggcta cctgtacgca ctcctcggat 2580 ttcggcggcg tcttgacact gacgtacaag accaacaaga acggggactg ctctgtacac 2640 tcgcactcta acgtagctac tctacaggag gccacagcaa aagtgaagac agcaggtaag 2700 gtgaccttac acttctccac ggcaagcgca tcaccttctt ttgtggtgtc gctatgcagt 2760 gctagggcca cctgttcagc gtcgtgtgag cccccgaaag accacatagt cccatatgcg 2820 gctagccaca gtaacgtagt gtttccagac atgtcgggca ccgcactatc atgggtgcag 2880 aaaatctcgg gtggtctggg ggccttcgca atcggcgcta tcctggtgct ggttgtggtc 2940 acttgcattg ggctccgcag ataa 2964 <210> 566 <211> 987 <212> PRT <213> Alphavirus Semliki Forest virus <400> 566 Met Ser Ala Pro Leu Ile Thr Ala Met Cys Val Leu Ala Asn Ala Thr 1 5 10 15 Phe Pro Cys Phe Gln Pro Pro Cys Val Pro Cys Cys Tyr Glu Asn Asn 20 25 30 Ala Glu Ala Thr Leu Arg Met Leu Glu Asp Asn Val Asp Arg Pro Gly 35 40 45 Tyr Tyr Asp Leu Leu Gln Ala Ala Leu Thr Cys Arg Asn Gly Thr Arg 50 55 60 His Arg Arg Ser Val Ser Gln His Phe Asn Val Tyr Lys Ala Thr Arg 65 70 75 80 Pro Tyr Ile Ala Tyr Cys Ala Asp Cys Gly Ala Gly His Ser Cys His 85 90 95 Ser Pro Val Ala Ile Glu Ala Val Arg Ser Glu Ala Thr Asp Gly Met 100 105 110 Leu Lys Ile Gln Phe Ser Ala Gln Ile Gly Ile Asp Lys Ser Asp Asn 115 120 125 His Asp Tyr Thr Lys Ile Arg Tyr Ala Asp Gly His Ala Ile Glu Asn 130 135 140 Ala Val Arg Ser Ser Leu Lys Val Ala Thr Ser Gly Asp Cys Phe Val 145 150 155 160 His Gly Thr Met Gly His Phe Ile Leu Ala Lys Cys Pro Pro Gly Glu 165 170 175 Phe Leu Gln Val Ser Ile Gln Asp Thr Arg Asn Ala Val Arg Ala Cys 180 185 190 Arg Ile Gln Tyr His His Asp Pro Gln Pro Val Gly Arg Glu Lys Phe 195 200 205 Thr Ile Arg Pro His Tyr Gly Lys Glu Ile Pro Cys Thr Thr Tyr Gln 210 215 220 Gln Thr Thr Ala Glu Thr Val Glu Glu Ile Asp Met His Met Pro Pro 225 230 235 240 Asp Thr Pro Asp Arg Thr Leu Leu Ser Gln Gln Ser Gly Asn Val Lys 245 250 255 Ile Thr Val Gly Gly Lys Lys Val Lys Tyr Asn Cys Thr Cys Gly Thr 260 265 270 Gly Asn Val Gly Thr Thr Asn Ser Asp Met Thr Ile Asn Thr Cys Leu 275 280 285 Ile Glu Gln Cys His Val Ser Val Thr Asp His Lys Lys Trp Gln Phe 290 295 300 Asn Ser Pro Phe Val Pro Arg Ala Asp Glu Pro Ala Arg Lys Gly Lys 305 310 315 320 Val His Ile Pro Phe Pro Leu Asp Asn Ile Thr Cys Arg Val Pro Met 325 330 335 Ala Arg Glu Pro Thr Val Ile His Gly Lys Arg Glu Val Thr Leu His 340 345 350 Leu His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Thr Leu Gly Glu 355 360 365 Asp Pro Gln Tyr His Glu Glu Trp Val Thr Ala Ala Val Glu Arg Thr 370 375 380 Ile Pro Val Pro Val Asp Gly Met Glu Tyr His Trp Gly Asn Asn Asp 385 390 395 400 Pro Val Arg Leu Trp Ser Gln Leu Thr Thr Glu Gly Lys Pro His Gly 405 410 415 Trp Pro His Gln Ile Val Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala 420 425 430 Thr Val Ser Ala Val Val Gly Met Ser Leu Leu Ala Leu Ile Ser Ile 435 440 445 Phe Ala Ser Cys Tyr Met Leu Val Ala Ala Arg Ser Lys Cys Leu Thr 450 455 460 Pro Tyr Ala Leu Thr Pro Gly Ala Ala Val Pro Trp Thr Leu Gly Ile 465 470 475 480 Leu Cys Cys Ala Pro Arg Ala His Ala Ala Ser Val Ala Glu Thr Met 485 490 495 Ala Tyr Leu Trp Asp Gln Asn Gln Ala Leu Phe Trp Leu Glu Phe Ala 500 505 510 Ala Pro Val Ala Cys Ile Leu Ile Ile Thr Tyr Cys Leu Arg Asn Val 515 520 525 Leu Cys Cys Cys Lys Ser Leu Ser Phe Leu Val Leu Leu Ser Leu Gly 530 535 540 Ala Thr Ala Arg Ala Tyr Glu His Ser Thr Val Met Pro Asn Val Val 545 550 555 560 Gly Phe Pro Tyr Lys Ala His Ile Glu Arg Pro Gly Tyr Ser Pro Leu 565 570 575 Thr Leu Gln Met Gln Val Val Glu Thr Ser Leu Glu Pro Thr Leu Asn 580 585 590 Leu Glu Tyr Ile Thr Cys Glu Tyr Lys Thr Val Val Pro Ser Pro Tyr 595 600 605 Val Lys Cys Cys Gly Ala Ser Glu Cys Ser Thr Lys Glu Lys Pro Asp 610 615 620 Tyr Gln Cys Lys Val Tyr Thr Gly Val Tyr Pro Phe Met Trp Gly Gly 625 630 635 640 Ala Tyr Cys Phe Cys Asp Ser Glu Asn Thr Gln Leu Ser Glu Ala Tyr 645 650 655 Val Asp Arg Ser Asp Val Cys Arg His Asp His Ala Ser Ala Tyr Lys 660 665 670 Ala His Thr Ala Ser Leu Lys Ala Lys Val Arg Val Met Tyr Gly Asn 675 680 685 Val Asn Gln Thr Val Asp Val Tyr Val Asn Gly Asp His Ala Val Thr 690 695 700 Ile Gly Gly Thr Gln Phe Ile Phe Gly Pro Leu Ser Ser Ala Trp Thr 705 710 715 720 Pro Phe Asp Asn Lys Ile Val Val Tyr Lys Asp Glu Val Phe Asn Gln 725 730 735 Asp Phe Pro Pro Tyr Gly Ser Gly Gln Pro Gly Arg Phe Gly Asp Ile 740 745 750 Gln Ser Arg Thr Val Glu Ser Asn Asp Leu Tyr Ala Asn Thr Ala Leu 755 760 765 Lys Leu Ala Arg Pro Ser Pro Gly Met Val His Val Pro Tyr Thr Gln 770 775 780 Thr Pro Ser Gly Phe Lys Tyr Trp Leu Lys Glu Lys Gly Thr Ala Leu 785 790 795 800 Asn Thr Lys Ala Pro Phe Gly Cys Gln Ile Lys Thr Asn Pro Val Arg 805 810 815 Ala Met Asn Cys Ala Val Gly Asn Ile Pro Val Ser Met Asn Leu Pro 820 825 830 Asp Ser Ala Phe Thr Arg Ile Val Glu Ala Pro Thr Ile Ile Asp Leu 835 840 845 Thr Cys Thr Val Ala Thr Cys Thr His Ser Ser Asp Phe Gly Gly Val 850 855 860 Leu Thr Leu Thr Tyr Lys Thr Asn Lys Asn Gly Asp Cys Ser Val His 865 870 875 880 Ser His Ser Asn Val Ala Thr Leu Gln Glu Ala Thr Ala Lys Val Lys 885 890 895 Thr Ala Gly Lys Val Thr Leu His Phe Ser Thr Ala Ser Ala Ser Pro 900 905 910 Ser Phe Val Val Ser Leu Cys Ser Ala Arg Ala Thr Cys Ser Ala Ser 915 920 925 Cys Glu Pro Pro Lys Asp His Ile Val Pro Tyr Ala Ala Ser His Ser 930 935 940 Asn Val Val Phe Pro Asp Met Ser Gly Thr Ala Leu Ser Trp Val Gln 945 950 955 960 Lys Ile Ser Gly Gly Leu Gly Ala Phe Ala Ile Gly Ala Ile Leu Val 965 970 975 Leu Val Val Val Thr Cys Ile Gly Leu Arg Arg 980 985 <210> 567 <211> 2949 <212> DNA <213> Alphavirus Sindbis virus <400> 567 atgtccgcag caccactggt cacggcaatg tgtttgctcg gaaatgtgag cttcccatgc 60 gaccgcccgc ccacatgcta tacccgcgaa ccttccagag ccctcgacat ccttgaagag 120 aacgtgaacc atgaggccta cgataccctg ctcaatgcca tattgcggtg cggatcgtct 180 ggcagaagca aaagaagcgt cattgacgac tttaccctga ccagccccta cttgggcaca 240 tgctcgtact gccaccatac tgtaccgtgc ttcagccctg ttaagatcga gcaggtctgg 300 gacgaagcgg acgataacac catacgcata cagacttccg cccagtttgg atacgaccaa 360 agcggagcag caagcgcaaa caagtaccgc tacatgtcgc ttaagcagga tcacaccgtt 420 aaagaaggca ccatggatga catcaagatt agcacctcag gaccgtgtag aaggcttagc 480 tacaaaggat actttctcct cgcaaaatgc cctccagggg acagcgtaac ggttagcata 540 gtgagtagca actcagcaac gtcatgtaca ctggcccgca agataaaacc aaaattcgtg 600 ggacgggaaa aatatgatct acctcccgtt cacggtaaaa aaattccttg cacagtgtac 660 gaccgtctga aagaaacaac tgcaggctac atcactatgc acaggccgag accgcacgct 720 tatacatcct acctggaaga atcatcaggg aaagtttacg caaagccgcc atctgggaag 780 aacattacgt atgagtgcaa gtgcggcgac tacaagaccg gaaccgtttc gacccgcacc 840 gaaatcactg gttgcaccgc catcaagcag tgcgtcgcct ataagagcga ccaaacgaag 900 tgggtcttca actcaccgga cttgatcaga catgacgacc acacggccca agggaaattg 960 catttgcctt tcaagttgat cccgagtacc tgcatggtcc ctgttgccca cgcgccgaat 1020 gtaatacatg gctttaaaca catcagcctc caattagata cagaccactt gacattgctc 1080 accaccagga gactaggggc aaacccggaa ccaaccactg aatggatcgt cggaaagacg 1140 gtcagaaact tcaccgtcga ccgagatggc ctggaataca tatggggaaa tcatgagcca 1200 gtgagggtct atgcccaaga gtcagcacca ggagaccctc acggatggcc acacgaaata 1260 gtacagcatt actaccatcg ccatcctgtg tacaccatct tagccgtcgc atcagctacc 1320 gtggcgatga tgattggcgt aactgttgca gtgttatgtg cctgtaaagc gcgccgtgag 1380 tgcctgacgc catacgccct ggccccaaac gccgtaatcc caacttcgct ggcactcttg 1440 tgctgcgtta ggtcggccaa tgctgaaacg ttcaccgaga ccatgagtta cttgtggtcg 1500 aacagtcagc cgttcttctg ggtccagttg tgcatacctt tggccgcttt catcgttcta 1560 atgcgctgct gctcctgctg cctgcctttt ttagtggttg ccggcgccta cctggcgaag 1620 gtagacgcct acgaacatgc gaccactgtt ccaaatgtgc cacagatacc gtataaggca 1680 cttgttgaaa gggcagggta tgccccgctc aatttggaga tcactgtcat gtcctcggag 1740 gttttgcctt ccaccaacca agagtacatt acctgcaaat tcaccactgt ggtcccctcc 1800 ccaaaaatca aatgctgcgg ctccttggaa tgtcagccgg ccgctcatgc agactatacc 1860 tgcaaggtct tcggaggggt ctaccccttt atgtggggag gagcgcaatg tttttgcgac 1920 agtgagaaca gccagatgag tgaggcgtac gtcgaattgt cagcagattg cgcgtctgac 1980 cacgcgcagg cgattaaggt gcacactgcc gcgatgaaag taggactgcg tattgtgtac 2040 gggaacacta ccagtttcct agatgtgtac gtgaacggag tcacaccagg aacgtctaaa 2100 gacttgaaag tcatagctgg accaatttca gcatcgttta cgccattcga tcataaggtc 2160 gttatccatc gcggcctggt gtacaactat gacttcccgg aatatggagc gatgaaacca 2220 ggagcgtttg gagacattca agctacctcc ttgactagca aggatctcat cgccagcaca 2280 gacattaggc tactcaagcc ttccgccaag aacgtgcatg tcccgtacac gcaggcctca 2340 tcaggatttg agatgtggaa aaacaactca ggccgcccac tgcaggaaac cgcacctttc 2400 gggtgtaaga ttgcagtaaa tccgctccga gcggtggact gttcatacgg gaacattccc 2460 atttctattg acatcccgaa cgctgccttt atcaggacat cagatgcacc actggtctca 2520 acagtcaaat gtgaagtcag tgagtgcact tattcagcag acttcggcgg gatggccacc 2580 ctgcagtatg tatccgaccg cgaaggtcaa tgccccgtac attcgcattc gagcacagca 2640 actctccaag agtcgacagt acatgtcctg gagaaaggag cggtgacagt acactttagc 2700 accgcgagtc cacaggcgaa ctttatcgta tcgctgtgtg ggaagaagac aacatgcaat 2760 gcagaatgta aaccaccagc tgaccatatc gtgagcaccc cgcacaaaaa tgaccaagaa 2820 tttcaagccg ccatctcaaa aacatcatgg agttggctgt ttgccctttt cggcggcgcc 2880 tcgtcgctat taattatagg acttatgatt tttgcttgca gcatgatgct gactagcaca 2940 cgaagatga 2949 <210> 568 <211> 982 <212> PRT <213> Alphavirus Sindbis virus <400> 568 Met Ser Ala Ala Pro Leu Val Thr Ala Met Cys Leu Leu Gly Asn Val 1 5 10 15 Ser Phe Pro Cys Asp Arg Pro Pro Thr Cys Tyr Thr Arg Glu Pro Ser 20 25 30 Arg Ala Leu Asp Ile Leu Glu Glu Asn Val Asn His Glu Ala Tyr Asp 35 40 45 Thr Leu Leu Asn Ala Ile Leu Arg Cys Gly Ser Ser Gly Arg Ser Lys 50 55 60 Arg Ser Val Ile Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly Thr 65 70 75 80 Cys Ser Tyr Cys His His Thr Val Pro Cys Phe Ser Pro Val Lys Ile 85 90 95 Glu Gln Val Trp Asp Glu Ala Asp Asp Asn Thr Ile Arg Ile Gln Thr 100 105 110 Ser Ala Gln Phe Gly Tyr Asp Gln Ser Gly Ala Ala Ser Ala Asn Lys 115 120 125 Tyr Arg Tyr Met Ser Leu Lys Gln Asp His Thr Val Lys Glu Gly Thr 130 135 140 Met Asp Asp Ile Lys Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu Ser 145 150 155 160 Tyr Lys Gly Tyr Phe Leu Leu Ala Lys Cys Pro Pro Gly Asp Ser Val 165 170 175 Thr Val Ser Ile Val Ser Ser Asn Ser Ala Thr Ser Cys Thr Leu Ala 180 185 190 Arg Lys Ile Lys Pro Lys Phe Val Gly Arg Glu Lys Tyr Asp Leu Pro 195 200 205 Pro Val His Gly Lys Lys Ile Pro Cys Thr Val Tyr Asp Arg Leu Lys 210 215 220 Glu Thr Thr Ala Gly Tyr Ile Thr Met His Arg Pro Arg Pro His Ala 225 230 235 240 Tyr Thr Ser Tyr Leu Glu Glu Ser Ser Gly Lys Val Tyr Ala Lys Pro 245 250 255 Pro Ser Gly Lys Asn Ile Thr Tyr Glu Cys Lys Cys Gly Asp Tyr Lys 260 265 270 Thr Gly Thr Val Ser Thr Arg Thr Glu Ile Thr Gly Cys Thr Ala Ile 275 280 285 Lys Gln Cys Val Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Phe Asn 290 295 300 Ser Pro Asp Leu Ile Arg His Asp Asp His Thr Ala Gln Gly Lys Leu 305 310 315 320 His Leu Pro Phe Lys Leu Ile Pro Ser Thr Cys Met Val Pro Val Ala 325 330 335 His Ala Pro Asn Val Ile His Gly Phe Lys His Ile Ser Leu Gln Leu 340 345 350 Asp Thr Asp His Leu Thr Leu Leu Thr Thr Arg Arg Leu Gly Ala Asn 355 360 365 Pro Glu Pro Thr Thr Glu Trp Ile Val Gly Lys Thr Val Arg Asn Phe 370 375 380 Thr Val Asp Arg Asp Gly Leu Glu Tyr Ile Trp Gly Asn His Glu Pro 385 390 395 400 Val Arg Val Tyr Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly Trp 405 410 415 Pro His Glu Ile Val Gln His Tyr Tyr His Arg His Pro Val Tyr Thr 420 425 430 Ile Leu Ala Val Ala Ser Ala Thr Val Ala Met Met Ile Gly Val Thr 435 440 445 Val Ala Val Leu Cys Ala Cys Lys Ala Arg Arg Glu Cys Leu Thr Pro 450 455 460 Tyr Ala Leu Ala Pro Asn Ala Val Ile Pro Thr Ser Leu Ala Leu Leu 465 470 475 480 Cys Cys Val Arg Ser Ala Asn Ala Glu Thr Phe Thr Glu Thr Met Ser 485 490 495 Tyr Leu Trp Ser Asn Ser Gln Pro Phe Phe Trp Val Gln Leu Cys Ile 500 505 510 Pro Leu Ala Ala Phe Ile Val Leu Met Arg Cys Cys Ser Cys Cys Leu 515 520 525 Pro Phe Leu Val Val Ala Gly Ala Tyr Leu Ala Lys Val Asp Ala Tyr 530 535 540 Glu His Ala Thr Thr Val Pro Asn Val Pro Gln Ile Pro Tyr Lys Ala 545 550 555 560 Leu Val Glu Arg Ala Gly Tyr Ala Pro Leu Asn Leu Glu Ile Thr Val 565 570 575 Met Ser Ser Glu Val Leu Pro Ser Thr Asn Gln Glu Tyr Ile Thr Cys 580 585 590 Lys Phe Thr Thr Val Val Pro Ser Pro Lys Ile Lys Cys Cys Gly Ser 595 600 605 Leu Glu Cys Gln Pro Ala Ala His Ala Asp Tyr Thr Cys Lys Val Phe 610 615 620 Gly Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Gln Cys Phe Cys Asp 625 630 635 640 Ser Glu Asn Ser Gln Met Ser Glu Ala Tyr Val Glu Leu Ser Ala Asp 645 650 655 Cys Ala Ser Asp His Ala Gln Ala Ile Lys Val His Thr Ala Ala Met 660 665 670 Lys Val Gly Leu Arg Ile Val Tyr Gly Asn Thr Thr Ser Phe Leu Asp 675 680 685 Val Tyr Val Asn Gly Val Thr Pro Gly Thr Ser Lys Asp Leu Lys Val 690 695 700 Ile Ala Gly Pro Ile Ser Ala Ser Phe Thr Pro Phe Asp His Lys Val 705 710 715 720 Val Ile His Arg Gly Leu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly 725 730 735 Ala Met Lys Pro Gly Ala Phe Gly Asp Ile Gln Ala Thr Ser Leu Thr 740 745 750 Ser Lys Asp Leu Ile Ala Ser Thr Asp Ile Arg Leu Leu Lys Pro Ser 755 760 765 Ala Lys Asn Val His Val Pro Tyr Thr Gln Ala Ser Ser Gly Phe Glu 770 775 780 Met Trp Lys Asn Asn Ser Gly Arg Pro Leu Gln Glu Thr Ala Pro Phe 785 790 795 800 Gly Cys Lys Ile Ala Val Asn Pro Leu Arg Ala Val Asp Cys Ser Tyr 805 810 815 Gly Asn Ile Pro Ile Ser Ile Asp Ile Pro Asn Ala Ala Phe Ile Arg 820 825 830 Thr Ser Asp Ala Pro Leu Val Ser Thr Val Lys Cys Glu Val Ser Glu 835 840 845 Cys Thr Tyr Ser Ala Asp Phe Gly Gly Met Ala Thr Leu Gln Tyr Val 850 855 860 Ser Asp Arg Glu Gly Gln Cys Pro Val His Ser His Ser Ser Thr Ala 865 870 875 880 Thr Leu Gln Glu Ser Thr Val His Val Leu Glu Lys Gly Ala Val Thr 885 890 895 Val His Phe Ser Thr Ala Ser Pro Gln Ala Asn Phe Ile Val Ser Leu 900 905 910 Cys Gly Lys Lys Thr Thr Cys Asn Ala Glu Cys Lys Pro Pro Ala Asp 915 920 925 His Ile Val Ser Thr Pro His Lys Asn Asp Gln Glu Phe Gln Ala Ala 930 935 940 Ile Ser Lys Thr Ser Trp Ser Trp Leu Phe Ala Leu Phe Gly Gly Ala 945 950 955 960 Ser Ser Leu Leu Ile Ile Gly Leu Met Ile Phe Ala Cys Ser Met Met 965 970 975 Leu Thr Ser Thr Arg Arg 980 <210> 569 <211> 2946 <212> DNA <213> Alphavirus Chikungunya virus <400> 569 atgtgcctgt tggcaaacac cacgttcccc tgctcccagc ccccttgcac gccctgctgc 60 tacgaaaagg aaccggagga aaccctacgc atgcttgagg acaacgtcat gagacctggg 120 tactatcagc tgctacaagc atccttaaca tgttctcccc accgccagcg acgcagcacc 180 aaggacaact tcaatgtcta taaagccaca agaccatact tagctcactg tcccgactgt 240 ggagaagggc actcgtgcca tagtcccgta gcactagaac gcatcagaaa tgaagcgaca 300 gacgggacgc tgaaaatcca ggtctccttg caaatcggaa taaagacgga tgacagccac 360 gattggacca agctgcgtta tatggacaac cacatgccag cagacgcaga gagggcgggg 420 ctatttgtaa gaacatcagc accgtgtacg attactggga caatgggaca cttcatcctg 480 gcccgatgtc caaaagggga aactctgacg gtgggattca ctgacagtag gaagattagt 540 cactcatgta cgcacccatt tcaccacgac cctcctgtga taggtcggga aaaattccat 600 tcccgaccgc agcacggtaa agagctacct tgcagcacgt acgtgcagag caccgccgca 660 actaccgagg agatagaggt acacatgccc ccagacaccc ctgatcgcac attaatgtca 720 caacagtccg gcaacgtaaa gatcacagtc aatggccaga cggtgcggta caagtgtaat 780 tgcggtggct caaatgaagg actaacaact acagacaaag tgattaataa ctgcaaggtt 840 gatcaatgtc atgccgcggt caccaatcac aaaaagtggc agtataactc ccctctggtc 900 ccgcgtaatg ctgaacttgg ggaccgaaaa ggaaaaattc acatcccgtt tccgctggca 960 aatgtaacat gcagggtgcc taaagcaagg aaccccaccg tgacgtacgg gaaaaaccaa 1020 gtcatcatgc tactgtatcc tgaccaccca acactcctgt cctaccggaa tatgggagaa 1080 gaaccaaact atcaagaaga gtgggtgatg cataagaagg aagtcgtgct aaccgtgccg 1140 actgaagggc tcgaggtcac gtggggcaac aacgagccgt ataagtattg gccgcagtta 1200 tctacaaacg gtacagccca tggccacccg catgagataa ttctgtatta ttatgagctg 1260 taccccacta tgactgtagt agttgtgtca gtggccacgt tcatactcct gtcgatggtg 1320 ggtatggcag cggggatgtg catgtgtgca cgacgcagat gcatcacacc gtatgaactg 1380 acaccaggag ctaccgtccc tttcctgctt agcctaatat gctgcatcag aacagctaaa 1440 gcggccacat accaagaggc tgcgatatac ctgtggaacg agcagcaacc tttgttttgg 1500 ctacaagccc ttattccgct ggcagccctg attgttctat gcaactgtct gagactctta 1560 ccatgctgct gtaaaacgtt ggctttttta gccgtaatga gcgtcggtgc ccacactgtg 1620 agcgcgtacg aacacgtaac agtgatcccg aacacggtgg gagtaccgta taagactcta 1680 gtcaatagac ctggctacag ccccatggta ttggagatgg aactactgtc agtcactttg 1740 gagccaacac tatcgcttga ttacatcacg tgcgagtaca aaaccgtcat cccgtctccg 1800 tacgtgaagt gctgcggtac agcagagtgc aaggacaaaa acctacctga ctacagctgt 1860 aaggtcttca ccggcgtcta cccatttatg tggggcggcg cctactgctt ctgcgacgct 1920 gaaaacacgc agttgagcga agcacacgtg gagaagtccg aatcatgcaa aacagaattt 1980 gcatcagcat acagggctca taccgcatct gcatcagcta agctccgcgt cctttaccaa 2040 ggaaataaca tcactgtaac tgcctatgca aacggcgacc atgccgtcac agttaaggac 2100 gccaaattca ttgtggggcc aatgtcttca gcctggacac ctttcgacaa caaaattgtg 2160 gtgtacaaag gtgacgtcta taacatggac tacccgccct ttggcgcagg aagaccagga 2220 caatttggcg atatccaaag tcgcacacct gagagtaaag acgtctatgc taatacacaa 2280 ctggtactgc agagaccggc tgtgggtacg gtacacgtgc catactctca ggcaccatct 2340 ggctttaagt attggctaaa agaacgcggg gcgtcgctgc agcacacagc accatttggc 2400 tgccaaatag caacaaaccc ggtaagagcg gtgaactgcg ccgtagggaa catgcccatc 2460 tccatcgaca taccggaagc ggccttcact agggtcgtcg acgcgccctc tttaacggac 2520 atgtcgtgcg aggtaccagc ctgcacccat tcctcagact ttgggggcgt cgccattatt 2580 aaatatgcag ccagcaagaa aggcaagtgt gcggtgcatt cgatgactaa cgccgtcact 2640 attcgggaag ctgagataga agttgaaggg aattctcagc tgcaaatctc tttctcgacg 2700 gccttagcca gcgccgaatt ccgcgtacaa gtctgttcta cacaagtaca ctgtgcagcc 2760 gagtgccacc ccccgaagga ccacatagtc aactacccgg cgtcacatac caccctcggg 2820 gtccaggaca tctccgctac ggcgatgtca tgggtgcaga agatcacggg aggtgtggga 2880 ctggttgttg ctgttgccgc actgattcta atcgtggtgc tatgcgtgtc gttcagcagg 2940 cactaa 2946 <210> 570 <211> 981 <212> PRT <213> Alphavirus Chikungunya virus <400> 570 Met Cys Leu Leu Ala Asn Thr Thr Phe Pro Cys Ser Gln Pro Pro Cys 1 5 10 15 Thr Pro Cys Cys Tyr Glu Lys Glu Pro Glu Glu Thr Leu Arg Met Leu 20 25 30 Glu Asp Asn Val Met Arg Pro Gly Tyr Tyr Gln Leu Leu Gln Ala Ser 35 40 45 Leu Thr Cys Ser Pro His Arg Gln Arg Arg Ser Thr Lys Asp Asn Phe 50 55 60 Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ala His Cys Pro Asp Cys 65 70 75 80 Gly Glu Gly His Ser Cys His Ser Pro Val Ala Leu Glu Arg Ile Arg 85 90 95 Asn Glu Ala Thr Asp Gly Thr Leu Lys Ile Gln Val Ser Leu Gln Ile 100 105 110 Gly Ile Lys Thr Asp Asp Ser His Asp Trp Thr Lys Leu Arg Tyr Met 115 120 125 Asp Asn His Met Pro Ala Asp Ala Glu Arg Ala Gly Leu Phe Val Arg 130 135 140 Thr Ser Ala Pro Cys Thr Ile Thr Gly Thr Met Gly His Phe Ile Leu 145 150 155 160 Ala Arg Cys Pro Lys Gly Glu Thr Leu Thr Val Gly Phe Thr Asp Ser 165 170 175 Arg Lys Ile Ser His Ser Cys Thr His Pro Phe His His Asp Pro Pro 180 185 190 Val Ile Gly Arg Glu Lys Phe His Ser Arg Pro Gln His Gly Lys Glu 195 200 205 Leu Pro Cys Ser Thr Tyr Val Gln Ser Thr Ala Ala Thr Thr Glu Glu 210 215 220 Ile Glu Val His Met Pro Pro Asp Thr Pro Asp Arg Thr Leu Met Ser 225 230 235 240 Gln Gln Ser Gly Asn Val Lys Ile Thr Val Asn Gly Gln Thr Val Arg 245 250 255 Tyr Lys Cys Asn Cys Gly Gly Ser Asn Glu Gly Leu Thr Thr Thr Asp 260 265 270 Lys Val Ile Asn Asn Cys Lys Val Asp Gln Cys His Ala Ala Val Thr 275 280 285 Asn His Lys Lys Trp Gln Tyr Asn Ser Pro Leu Val Pro Arg Asn Ala 290 295 300 Glu Leu Gly Asp Arg Lys Gly Lys Ile His Ile Pro Phe Pro Leu Ala 305 310 315 320 Asn Val Thr Cys Arg Val Pro Lys Ala Arg Asn Pro Thr Val Thr Tyr 325 330 335 Gly Lys Asn Gln Val Ile Met Leu Leu Tyr Pro Asp His Pro Thr Leu 340 345 350 Leu Ser Tyr Arg Asn Met Gly Glu Glu Pro Asn Tyr Gln Glu Glu Trp 355 360 365 Val Met His Lys Lys Glu Val Val Leu Thr Val Pro Thr Glu Gly Leu 370 375 380 Glu Val Thr Trp Gly Asn Asn Glu Pro Tyr Lys Tyr Trp Pro Gln Leu 385 390 395 400 Ser Thr Asn Gly Thr Ala His Gly His Pro His Glu Ile Ile Leu Tyr 405 410 415 Tyr Tyr Glu Leu Tyr Pro Thr Met Thr Val Val Val Val Ser Val Ala 420 425 430 Thr Phe Ile Leu Leu Ser Met Val Gly Met Ala Ala Gly Met Cys Met 435 440 445 Cys Ala Arg Arg Arg Cys Ile Thr Pro Tyr Glu Leu Thr Pro Gly Ala 450 455 460 Thr Val Pro Phe Leu Leu Ser Leu Ile Cys Cys Ile Arg Thr Ala Lys 465 470 475 480 Ala Ala Thr Tyr Gln Glu Ala Ala Ile Tyr Leu Trp Asn Glu Gln Gln 485 490 495 Pro Leu Phe Trp Leu Gln Ala Leu Ile Pro Leu Ala Ala Leu Ile Val 500 505 510 Leu Cys Asn Cys Leu Arg Leu Leu Pro Cys Cys Cys Lys Thr Leu Ala 515 520 525 Phe Leu Ala Val Met Ser Val Gly Ala His Thr Val Ser Ala Tyr Glu 530 535 540 His Val Thr Val Ile Pro Asn Thr Val Gly Val Pro Tyr Lys Thr Leu 545 550 555 560 Val Asn Arg Pro Gly Tyr Ser Pro Met Val Leu Glu Met Glu Leu Leu 565 570 575 Ser Val Thr Leu Glu Pro Thr Leu Ser Leu Asp Tyr Ile Thr Cys Glu 580 585 590 Tyr Lys Thr Val Ile Pro Ser Pro Tyr Val Lys Cys Cys Gly Thr Ala 595 600 605 Glu Cys Lys Asp Lys Asn Leu Pro Asp Tyr Ser Cys Lys Val Phe Thr 610 615 620 Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Ala 625 630 635 640 Glu Asn Thr Gln Leu Ser Glu Ala His Val Glu Lys Ser Glu Ser Cys 645 650 655 Lys Thr Glu Phe Ala Ser Ala Tyr Arg Ala His Thr Ala Ser Ala Ser 660 665 670 Ala Lys Leu Arg Val Leu Tyr Gln Gly Asn Asn Ile Thr Val Thr Ala 675 680 685 Tyr Ala Asn Gly Asp His Ala Val Thr Val Lys Asp Ala Lys Phe Ile 690 695 700 Val Gly Pro Met Ser Ser Ala Trp Thr Pro Phe Asp Asn Lys Ile Val 705 710 715 720 Val Tyr Lys Gly Asp Val Tyr Asn Met Asp Tyr Pro Pro Phe Gly Ala 725 730 735 Gly Arg Pro Gly Gln Phe Gly Asp Ile Gln Ser Arg Thr Pro Glu Ser 740 745 750 Lys Asp Val Tyr Ala Asn Thr Gln Leu Val Leu Gln Arg Pro Ala Val 755 760 765 Gly Thr Val His Val Pro Tyr Ser Gln Ala Pro Ser Gly Phe Lys Tyr 770 775 780 Trp Leu Lys Glu Arg Gly Ala Ser Leu Gln His Thr Ala Pro Phe Gly 785 790 795 800 Cys Gln Ile Ala Thr Asn Pro Val Arg Ala Val Asn Cys Ala Val Gly 805 810 815 Asn Met Pro Ile Ser Ile Asp Ile Pro Glu Ala Ala Phe Thr Arg Val 820 825 830 Val Asp Ala Pro Ser Leu Thr Asp Met Ser Cys Glu Val Pro Ala Cys 835 840 845 Thr His Ser Ser Asp Phe Gly Gly Val Ala Ile Ile Lys Tyr Ala Ala 850 855 860 Ser Lys Lys Gly Lys Cys Ala Val His Ser Met Thr Asn Ala Val Thr 865 870 875 880 Ile Arg Glu Ala Glu Ile Glu Val Glu Gly Asn Ser Gln Leu Gln Ile 885 890 895 Ser Phe Ser Thr Ala Leu Ala Ser Ala Glu Phe Arg Val Gln Val Cys 900 905 910 Ser Thr Gln Val His Cys Ala Ala Glu Cys His Pro Pro Lys Asp His 915 920 925 Ile Val Asn Tyr Pro Ala Ser His Thr Thr Leu Gly Val Gln Asp Ile 930 935 940 Ser Ala Thr Ala Met Ser Trp Val Gln Lys Ile Thr Gly Gly Val Gly 945 950 955 960 Leu Val Val Ala Val Ala Ala Leu Ile Leu Ile Val Val Leu Cys Val 965 970 975 Ser Phe Ser Arg His 980 <210> 571 <211> 1509 <212> DNA <213> Bornavirus Borna disease virus 1 <400> 571 atgcagctga gcatgagcag cctgatcggc ttcggcaccc tggtgctggc cctgagcgcc 60 cagaccttcg acctgcaggg cctgagctgc aacaccgaca gcacccccgg cctgatcgac 120 ctggagatca ggaggctgtg ccacaccccc accgagaacg tgatcagctg cgaggtgagc 180 tacctgaacc acaccaccat cagcctgccc gccgtgcaca ccagctgcct gaagtaccac 240 tgcaagacct actggggctt cttcggcagc tacagcgccg acaggatcat caacaggtac 300 accggcaccg tgaagggctg cctgaacaac agcgcccccg aggacccctt cgagtgcaac 360 tggttctact gctgcagcgc catcaccacc gagatctgca ggtgcagcat caccaacgtg 420 accgtggccg tgcagacctt cccccccttc atgtactgca gcttcgccga ctgcagcacc 480 gtgagccagc aggagctgga gagcggcaag gccatgctga gcgacggcag caccctgacc 540 tacaccccct acatcctgca gagcgaggtg gtgaacaaga ccctgaacgg caccatcctg 600 tgcaacagca gcagcaagat cgtgagcttc gacgagttca ggaggagcta cagcctggcc 660 aacggcagct accagagcag cagcatcaac gtgacctgcg tgaactacac cagcagctgc 720 aggagcaagc tgaggaggag gaggagggac acccagcaga tcgagtacct ggtgcacaag 780 ctgaggccca ccctgaagga cgcctgggag gactgcgaga tcctgcagag cctgctgctg 840 ggcgtgttcg gcaccggcat cgccagcgcc agccagttcc tgaggggctg gctgaaccac 900 cccgacatca tcggctacat cgtgaacggc gtgggcgtgg tgtggcagtg ccacagggtg 960 aacgtgacct tcatggcctg gaacgagagc acctactacc cccccgtgga ctacaacggc 1020 aggaagtact tcctgaacga cgagggcagg ctgcagacca acacccccga ggccaggccc 1080 ggcctgaaga gggtgatgtg gttcggcagg tacttcctgg gcaccgtggg cagcggcgtg 1140 aagcccagga ggatcaggta caacaagacc agccacgact accacctgga ggagttcgag 1200 gccagcctga acatgacccc ccagaccagc atcgccagcg gccacgagac cgaccccatc 1260 aaccacgcct acggcaccca ggccgacctg ctgccctaca ccaggagcag caacatcacc 1320 agcaccgaca ccggcagcgg ctgggtgcac atcggcctgc ccagcttcgc cttcctgaac 1380 cccctgggct ggctgaggga cctgctggcc tgggccgcct ggctgggcgg cgtgctgtac 1440 ctgatcagcc tgtgcgtgag cctgcccgcc agcttcgcca ggaggaggag gctgggcagg 1500 tggcaggag 1509 <210> 572 <211> 503 <212> PRT <213> Bornavirus Borna disease virus 1 <400> 572 Met Gln Leu Ser Met Ser Ser Leu Ile Gly Phe Gly Thr Leu Val Leu 1 5 10 15 Ala Leu Ser Ala Gln Thr Phe Asp Leu Gln Gly Leu Ser Cys Asn Thr 20 25 30 Asp Ser Thr Pro Gly Leu Ile Asp Leu Glu Ile Arg Arg Leu Cys His 35 40 45 Thr Pro Thr Glu Asn Val Ile Ser Cys Glu Val Ser Tyr Leu Asn His 50 55 60 Thr Thr Ile Ser Leu Pro Ala Val His Thr Ser Cys Leu Lys Tyr His 65 70 75 80 Cys Lys Thr Tyr Trp Gly Phe Phe Gly Ser Tyr Ser Ala Asp Arg Ile 85 90 95 Ile Asn Arg Tyr Thr Gly Thr Val Lys Gly Cys Leu Asn Asn Ser Ala 100 105 110 Pro Glu Asp Pro Phe Glu Cys Asn Trp Phe Tyr Cys Cys Ser Ala Ile 115 120 125 Thr Thr Glu Ile Cys Arg Cys Ser Ile Thr Asn Val Thr Val Ala Val 130 135 140 Gln Thr Phe Pro Pro Phe Met Tyr Cys Ser Phe Ala Asp Cys Ser Thr 145 150 155 160 Val Ser Gln Gln Glu Leu Glu Ser Gly Lys Ala Met Leu Ser Asp Gly 165 170 175 Ser Thr Leu Thr Tyr Thr Pro Tyr Ile Leu Gln Ser Glu Val Val Asn 180 185 190 Lys Thr Leu Asn Gly Thr Ile Leu Cys Asn Ser Ser Ser Lys Ile Val 195 200 205 Ser Phe Asp Glu Phe Arg Arg Ser Tyr Ser Leu Ala Asn Gly Ser Tyr 210 215 220 Gln Ser Ser Ser Ile Asn Val Thr Cys Val Asn Tyr Thr Ser Ser Cys 225 230 235 240 Arg Ser Lys Leu Arg Arg Arg Arg Arg Asp Thr Gln Gln Ile Glu Tyr 245 250 255 Leu Val His Lys Leu Arg Pro Thr Leu Lys Asp Ala Trp Glu Asp Cys 260 265 270 Glu Ile Leu Gln Ser Leu Leu Leu Gly Val Phe Gly Thr Gly Ile Ala 275 280 285 Ser Ala Ser Gln Phe Leu Arg Gly Trp Leu Asn His Pro Asp Ile Ile 290 295 300 Gly Tyr Ile Val Asn Gly Val Gly Val Val Trp Gln Cys His Arg Val 305 310 315 320 Asn Val Thr Phe Met Ala Trp Asn Glu Ser Thr Tyr Tyr Pro Pro Val 325 330 335 Asp Tyr Asn Gly Arg Lys Tyr Phe Leu Asn Asp Glu Gly Arg Leu Gln 340 345 350 Thr Asn Thr Pro Glu Ala Arg Pro Gly Leu Lys Arg Val Met Trp Phe 355 360 365 Gly Arg Tyr Phe Leu Gly Thr Val Gly Ser Gly Val Lys Pro Arg Arg 370 375 380 Ile Arg Tyr Asn Lys Thr Ser His Asp Tyr His Leu Glu Glu Phe Glu 385 390 395 400 Ala Ser Leu Asn Met Thr Pro Gln Thr Ser Ile Ala Ser Gly His Glu 405 410 415 Thr Asp Pro Ile Asn His Ala Tyr Gly Thr Gln Ala Asp Leu Leu Pro 420 425 430 Tyr Thr Arg Ser Ser Asn Ile Thr Ser Thr Asp Thr Gly Ser Gly Trp 435 440 445 Val His Ile Gly Leu Pro Ser Phe Ala Phe Leu Asn Pro Leu Gly Trp 450 455 460 Leu Arg Asp Leu Leu Ala Trp Ala Ala Trp Leu Gly Gly Val Leu Tyr 465 470 475 480 Leu Ile Ser Leu Cys Val Ser Leu Pro Ala Ser Phe Ala Arg Arg Arg 485 490 495 Arg Leu Gly Arg Trp Gln Glu 500 <210> 573 <211> 1488 <212> DNA <213> Flavivirus Tick-borne encephalitis virus <400> 573 agcaggtgca cccacctgga gaacagggac ttcgtgaccg gcacccaggg caccaccagg 60 gtgaccctgg tgctggagct gggcggctgc gtgaccatca ccgccgaggg caagcccagc 120 atggacgtgt ggctggacgc catctaccag gagaaccccg cccagaccag ggagtactgc 180 ctgcacgcca agctgagcga caccaaggtg gccgccaggt gccccaccat gggccccgcc 240 accctggccg aggagcacca gggcggcacc gtgtgcaaga gggaccagag cgacaggggc 300 tggggcaacc actgcggcct gttcggcaag ggcagcatcg tggcctgcgt gaaggccgcc 360 tgcgaggcca agaagaaggc caccggccac gtgtacgacg ccaacaagat cgtgtacacc 420 gtgaaggtgg agccccacac cggcgactac gtggccgcca acgagaccca cagcggcagg 480 aagaccgcca gcttcaccgt gagcagcgag aagaccatcc tgaccatggg cgagtacggc 540 gacgtgagcc tgctgtgcag ggtggccagc ggcgtggacc tggcccagac cgtgatcctg 600 gagctggaca agaccgtgga gcacctgccc accgcctggc aggtgcacag ggactggttc 660 aacgacctgg ccctgccctg gaagcacgag ggcgccagga actggaacaa cgccgagagg 720 ctggtggagt tcggcgcccc ccacgccgtg aagatggacg tgtacaacct gggcgaccag 780 accggcgtgc tgctgaaggc cctggccggc gtgcccgtgg cccacatcga gggcaccaag 840 taccacctga agagcggcca cgtgacctgc gaggtgggcc tggagaagct gaagatgaag 900 ggcctgacct acaccatgtg cgacaagacc aagttcacct ggaagagggc ccccaccgac 960 agcggccacg acaccgtggt gatggaggtg accttcagcg gcaccaagcc ctgcaggatc 1020 cccgtgaggg ccgtggccca cggcagcccc gacgtgaacg tggccatgct gatcaccccc 1080 aaccccacca tcgagaacaa cggcggcggc ttcatcgaga tgcagctgcc ccccggcgac 1140 aacatcatct acgtgggcga gctgagctac cagtggttcc agaagggcag cagcatcggc 1200 agggtgttcc agaagaccaa gaagggcatc gagaggctga ccgtgatcgg cgagcacgcc 1260 tgggacttcg gcagcgccgg cggcttcctg agcagcatcg gcaaggccct gcacaccgtg 1320 ctgggcggcg ccttcaacag catcttcggc ggcgtgggct tcctgcccaa gctgctgctg 1380 ggcgtggccc tggcctggct gggcctgaac atgaggaacc ccaccatgag catgagcttc 1440 ctgctggccg gcgtgctggt gctggccatg accctgggcg tgggcgcc 1488 <210> 574 <211> 496 <212> PRT <213> Flavivirus Tick-borne encephalitis virus <400> 574 Ser Arg Cys Thr His Leu Glu Asn Arg Asp Phe Val Thr Gly Thr Gln 1 5 10 15 Gly Thr Thr Arg Val Thr Leu Val Leu Glu Leu Gly Gly Cys Val Thr 20 25 30 Ile Thr Ala Glu Gly Lys Pro Ser Met Asp Val Trp Leu Asp Ala Ile 35 40 45 Tyr Gln Glu Asn Pro Ala Gln Thr Arg Glu Tyr Cys Leu His Ala Lys 50 55 60 Leu Ser Asp Thr Lys Val Ala Ala Arg Cys Pro Thr Met Gly Pro Ala 65 70 75 80 Thr Leu Ala Glu Glu His Gln Gly Gly Thr Val Cys Lys Arg Asp Gln 85 90 95 Ser Asp Arg Gly Trp Gly Asn His Cys Gly Leu Phe Gly Lys Gly Ser 100 105 110 Ile Val Ala Cys Val Lys Ala Ala Cys Glu Ala Lys Lys Lys Ala Thr 115 120 125 Gly His Val Tyr Asp Ala Asn Lys Ile Val Tyr Thr Val Lys Val Glu 130 135 140 Pro His Thr Gly Asp Tyr Val Ala Ala Asn Glu Thr His Ser Gly Arg 145 150 155 160 Lys Thr Ala Ser Phe Thr Val Ser Ser Glu Lys Thr Ile Leu Thr Met 165 170 175 Gly Glu Tyr Gly Asp Val Ser Leu Leu Cys Arg Val Ala Ser Gly Val 180 185 190 Asp Leu Ala Gln Thr Val Ile Leu Glu Leu Asp Lys Thr Val Glu His 195 200 205 Leu Pro Thr Ala Trp Gln Val His Arg Asp Trp Phe Asn Asp Leu Ala 210 215 220 Leu Pro Trp Lys His Glu Gly Ala Arg Asn Trp Asn Asn Ala Glu Arg 225 230 235 240 Leu Val Glu Phe Gly Ala Pro His Ala Val Lys Met Asp Val Tyr Asn 245 250 255 Leu Gly Asp Gln Thr Gly Val Leu Leu Lys Ala Leu Ala Gly Val Pro 260 265 270 Val Ala His Ile Glu Gly Thr Lys Tyr His Leu Lys Ser Gly His Val 275 280 285 Thr Cys Glu Val Gly Leu Glu Lys Leu Lys Met Lys Gly Leu Thr Tyr 290 295 300 Thr Met Cys Asp Lys Thr Lys Phe Thr Trp Lys Arg Ala Pro Thr Asp 305 310 315 320 Ser Gly His Asp Thr Val Val Met Glu Val Thr Phe Ser Gly Thr Lys 325 330 335 Pro Cys Arg Ile Pro Val Arg Ala Val Ala His Gly Ser Pro Asp Val 340 345 350 Asn Val Ala Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Asn Asn Gly 355 360 365 Gly Gly Phe Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr 370 375 380 Val Gly Glu Leu Ser Tyr Gln Trp Phe Gln Lys Gly Ser Ser Ile Gly 385 390 395 400 Arg Val Phe Gln Lys Thr Lys Lys Gly Ile Glu Arg Leu Thr Val Ile 405 410 415 Gly Glu His Ala Trp Asp Phe Gly Ser Ala Gly Gly Phe Leu Ser Ser 420 425 430 Ile Gly Lys Ala Leu His Thr Val Leu Gly Gly Ala Phe Asn Ser Ile 435 440 445 Phe Gly Gly Val Gly Phe Leu Pro Lys Leu Leu Leu Gly Val Ala Leu 450 455 460 Ala Trp Leu Gly Leu Asn Met Arg Asn Pro Thr Met Ser Met Ser Phe 465 470 475 480 Leu Leu Ala Gly Val Leu Val Leu Ala Met Thr Leu Gly Val Gly Ala 485 490 495 <210> 575 <211> 1836 <212> DNA <213> Flavivirus Usutu virus <400> 575 agcaccgtga gcaactgccc caccaccggc gaggcccaca accccaagag ggccgaggac 60 acctacgtgt gcaagagcgg cgtgaccgac aggggctggg gcaacggctg cggcctgttc 120 ggcaagggca gcatcgacac ctgcgccaac ttcacctgca gcctgaaggc catgggcagg 180 atgatccagc ccgagaacgt gaagtacgag gtgggcatct tcatccacgg cagcaccagc 240 agcgacaccc acggcaacta cagcagccag ctgggcgcca gccaggccgg caggttcacc 300 atcaccccca acagccccgc catcaccgtg aagatgggcg actacggcga gatcagcgtg 360 gagtgcgagc ccaggaacgg cctgaacacc gaggcctact acatcatgag cgtgggcacc 420 aagcacttcc tggtgcacag ggagtggttc aacgacctgg ccctgccctg gaccagcccc 480 gccagcagca actggaggaa cagggagatc ctgctggagt tcgaggagcc ccacgccacc 540 aagcagagcg tggtggccct gggcagccag gagggcgccc tgcaccaggc cctggccggc 600 gccgtgcccg tgagcttcag cggcagcgtg aagctgacca gcggccacct gaagtgcagg 660 gtgaagatgg agaagctgac cctgaagggc accacctacg gcatgtgcac cgagaagttc 720 agcttcgcca agaaccccgc cgacaccggc cacggcaccg tggtgctgga gctgcagtac 780 accggcagcg acggcccctg caagatcccc atcagcatcg tggccagcct gagcgacctg 840 acccccatcg gcaggatggt gaccgccaac ccctacgtgg ccagcagcga ggccaacgcc 900 aaggtgctgg tggagatgga gccccccttc ggcgacagct acatcgtggt gggcaggggc 960 gacaagcaga tcaaccacca ctggcacaag gccggcagca gcatcggcaa ggccttcatc 1020 accaccatca agggcgccca gaggctggcc gccctgggcg acaccgcctg ggacttcggc 1080 agcgtgggcg gcatcttcaa cagcgtgggc aaggccgtgc accaggtgtt cggcggcgcc 1140 ttcaggaccc tgttcggcgg catgagctgg atcacccagg gcctgatggg cgccctgctg 1200 ctgtggatgg gcgtgaacgc cagggacagg agcatcgccc tggtgatgct ggccaccggc 1260 ggcgtgctgc tgttcctggc caccaacgtg cacgccgaca gcggctgcgc catcgacgtg 1320 ggcaggaggg agctgaggtg cggccagggc atcttcatcc acaacgacgt ggaggcctgg 1380 gtggacaggt acaagttcat gcccgagacc cccaagcagc tggccaaggt gatcgagcag 1440 gcccacgcca agggcatctg cggcctgagg agcgtgagca ggctggagca cgtgatgtgg 1500 gagaacatca gggacgagct gaacaccctg ctgagggaga acgccgtgga cctgagcgtg 1560 gtggtggaga agcccaaggg catgtacaag agcgcccccc agaggctggc cctgaccagc 1620 gaggagttcg agatcggctg gaaggcctgg ggcaagagcc tggtgttcgc ccccgagctg 1680 gccaaccaca ccttcgtggt ggacggcccc gagaccaagg agtgccccga cgccaagagg 1740 gcctggaaca gcctggagat cgaggacttc ggcttcggca tcatgagcac cagggtgtgg 1800 ctgaaggtga gggagcacaa caccaccgac tgcgac 1836 <210> 576 <211> 612 <212> PRT <213> Flavivirus Usutu virus <400> 576 Ser Thr Val Ser Asn Cys Pro Thr Thr Gly Glu Ala His Asn Pro Lys 1 5 10 15 Arg Ala Glu Asp Thr Tyr Val Cys Lys Ser Gly Val Thr Asp Arg Gly 20 25 30 Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser Ile Asp Thr Cys 35 40 45 Ala Asn Phe Thr Cys Ser Leu Lys Ala Met Gly Arg Met Ile Gln Pro 50 55 60 Glu Asn Val Lys Tyr Glu Val Gly Ile Phe Ile His Gly Ser Thr Ser 65 70 75 80 Ser Asp Thr His Gly Asn Tyr Ser Ser Gln Leu Gly Ala Ser Gln Ala 85 90 95 Gly Arg Phe Thr Ile Thr Pro Asn Ser Pro Ala Ile Thr Val Lys Met 100 105 110 Gly Asp Tyr Gly Glu Ile Ser Val Glu Cys Glu Pro Arg Asn Gly Leu 115 120 125 Asn Thr Glu Ala Tyr Tyr Ile Met Ser Val Gly Thr Lys His Phe Leu 130 135 140 Val His Arg Glu Trp Phe Asn Asp Leu Ala Leu Pro Trp Thr Ser Pro 145 150 155 160 Ala Ser Ser Asn Trp Arg Asn Arg Glu Ile Leu Leu Glu Phe Glu Glu 165 170 175 Pro His Ala Thr Lys Gln Ser Val Val Ala Leu Gly Ser Gln Glu Gly 180 185 190 Ala Leu His Gln Ala Leu Ala Gly Ala Val Pro Val Ser Phe Ser Gly 195 200 205 Ser Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Val Lys Met Glu 210 215 220 Lys Leu Thr Leu Lys Gly Thr Thr Tyr Gly Met Cys Thr Glu Lys Phe 225 230 235 240 Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His Gly Thr Val Val Leu 245 250 255 Glu Leu Gln Tyr Thr Gly Ser Asp Gly Pro Cys Lys Ile Pro Ile Ser 260 265 270 Ile Val Ala Ser Leu Ser Asp Leu Thr Pro Ile Gly Arg Met Val Thr 275 280 285 Ala Asn Pro Tyr Val Ala Ser Ser Glu Ala Asn Ala Lys Val Leu Val 290 295 300 Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg Gly 305 310 315 320 Asp Lys Gln Ile Asn His His Trp His Lys Ala Gly Ser Ser Ile Gly 325 330 335 Lys Ala Phe Ile Thr Thr Ile Lys Gly Ala Gln Arg Leu Ala Ala Leu 340 345 350 Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Ile Phe Asn Ser 355 360 365 Val Gly Lys Ala Val His Gln Val Phe Gly Gly Ala Phe Arg Thr Leu 370 375 380 Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu Met Gly Ala Leu Leu 385 390 395 400 Leu Trp Met Gly Val Asn Ala Arg Asp Arg Ser Ile Ala Leu Val Met 405 410 415 Leu Ala Thr Gly Gly Val Leu Leu Phe Leu Ala Thr Asn Val His Ala 420 425 430 Asp Ser Gly Cys Ala Ile Asp Val Gly Arg Arg Glu Leu Arg Cys Gly 435 440 445 Gln Gly Ile Phe Ile His Asn Asp Val Glu Ala Trp Val Asp Arg Tyr 450 455 460 Lys Phe Met Pro Glu Thr Pro Lys Gln Leu Ala Lys Val Ile Glu Gln 465 470 475 480 Ala His Ala Lys Gly Ile Cys Gly Leu Arg Ser Val Ser Arg Leu Glu 485 490 495 His Val Met Trp Glu Asn Ile Arg Asp Glu Leu Asn Thr Leu Leu Arg 500 505 510 Glu Asn Ala Val Asp Leu Ser Val Val Val Glu Lys Pro Lys Gly Met 515 520 525 Tyr Lys Ser Ala Pro Gln Arg Leu Ala Leu Thr Ser Glu Glu Phe Glu 530 535 540 Ile Gly Trp Lys Ala Trp Gly Lys Ser Leu Val Phe Ala Pro Glu Leu 545 550 555 560 Ala Asn His Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys Pro 565 570 575 Asp Ala Lys Arg Ala Trp Asn Ser Leu Glu Ile Glu Asp Phe Gly Phe 580 585 590 Gly Ile Met Ser Thr Arg Val Trp Leu Lys Val Arg Glu His Asn Thr 595 600 605 Thr Asp Cys Asp 610 <210> 577 <211> 1503 <212> DNA <213> Flavivirus St. Louis encephalitis virus <400> 577 ttcaactgcc tgggcaccag caacagggac ttcgtggagg gcgccagcgg cgccacctgg 60 atcgacctgg tgctggaggg cggcagctgc gtgaccgtga tggcccccga gaagcccacc 120 ctggacttca aggtgatgaa gatggaggcc accgagctgg ccaccgtgag ggagtactgc 180 tacgaggcca ccctggacac cctgagcacc gtggccaggt gccccaccac cggcgaggcc 240 cacaacacca agaggagcga ccccaccttc gtgtgcaaga gggacgtggt ggacaggggc 300 tggggcaacg gctgcggcct gttcggcaag ggcagcatcg acacctgcgc caagttcacc 360 tgcaagagca aggccaccgg caagaccatc ctgagggaga acatcaagta cgaggtggcc 420 atcttcgtgc acggcagcac cgacagcacc acccacggca actacttcga gcagatcggc 480 aagaaccagg ccgccaggtt caccatcagc ccccaggccc ccagcttcac cgccaacatg 540 ggcgagtacg gcaccgtgac catcgactgc gaggccagga gcggcatcaa caccgaggac 600 tactacgtgt tcaccgtgaa ggagaagagc tggctggtga acagggactg gttccacgac 660 ctgaacctgc cctggaccag ccccgccacc accgactgga ggaacaggga gaccctggtg 720 gagttcgagg agccccacgc caccaagcag accgtggtgg ccctgggcag ccaggagggc 780 gccctgcaca ccgccctggc cggcgccatc cccgccaccg tgagcagcag caccctgacc 840 ctgcagagcg gccacctgaa gtgcagggcc aagctggaca aggtgaagat caagggcacc 900 acctacggca tgtgcgacag cgccttcacc ttcagcaaga accccgccga caccggccac 960 ggcaccgtga tcgtggagct gcagtacacc ggcagcaacg gcccctgcag ggtgcccatc 1020 agcgtgaccg ccaacctgat ggacctgacc cccgtgggca ggctggtgac cgtgaacccc 1080 ttcatcagca ccggcggcgc caacaacaag gtgatggtgg aggtggagcc ccccttcggc 1140 gacagctaca tcgtggtggg caggggcacc acccagatca actaccactg gcacaaggag 1200 ggcagcagca tcggcaaggc cctggccacc acctggaagg gcgcccagag gctggccgtg 1260 ctgggcgaca ccgcctggga cttcggcagc atcggcggcg tgttcaacag catcggcaag 1320 gccgtgcacc aggtgttcgg cggcgccttc aggaccctgt tcggcggcat gagctggatc 1380 acccagggcc tgctgggcgc cctgctgctg tggatgggcc tgcaggccag ggacaggagc 1440 atcagcctga ccctgctggc cgtgggcggc atcctgatct tcctggccac cagcgtgcag 1500 gcc 1503 <210> 578 <211> 501 <212> PRT <213> Flavivirus St. Louis encephalitis virus <400> 578 Phe Asn Cys Leu Gly Thr Ser Asn Arg Asp Phe Val Glu Gly Ala Ser 1 5 10 15 Gly Ala Thr Trp Ile Asp Leu Val Leu Glu Gly Gly Ser Cys Val Thr 20 25 30 Val Met Ala Pro Glu Lys Pro Thr Leu Asp Phe Lys Val Met Lys Met 35 40 45 Glu Ala Thr Glu Leu Ala Thr Val Arg Glu Tyr Cys Tyr Glu Ala Thr 50 55 60 Leu Asp Thr Leu Ser Thr Val Ala Arg Cys Pro Thr Thr Gly Glu Ala 65 70 75 80 His Asn Thr Lys Arg Ser Asp Pro Thr Phe Val Cys Lys Arg Asp Val 85 90 95 Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser 100 105 110 Ile Asp Thr Cys Ala Lys Phe Thr Cys Lys Ser Lys Ala Thr Gly Lys 115 120 125 Thr Ile Leu Arg Glu Asn Ile Lys Tyr Glu Val Ala Ile Phe Val His 130 135 140 Gly Ser Thr Asp Ser Thr Thr His Gly Asn Tyr Phe Glu Gln Ile Gly 145 150 155 160 Lys Asn Gln Ala Ala Arg Phe Thr Ile Ser Pro Gln Ala Pro Ser Phe 165 170 175 Thr Ala Asn Met Gly Glu Tyr Gly Thr Val Thr Ile Asp Cys Glu Ala 180 185 190 Arg Ser Gly Ile Asn Thr Glu Asp Tyr Tyr Val Phe Thr Val Lys Glu 195 200 205 Lys Ser Trp Leu Val Asn Arg Asp Trp Phe His Asp Leu Asn Leu Pro 210 215 220 Trp Thr Ser Pro Ala Thr Thr Asp Trp Arg Asn Arg Glu Thr Leu Val 225 230 235 240 Glu Phe Glu Glu Pro His Ala Thr Lys Gln Thr Val Val Ala Leu Gly 245 250 255 Ser Gln Glu Gly Ala Leu His Thr Ala Leu Ala Gly Ala Ile Pro Ala 260 265 270 Thr Val Ser Ser Ser Thr Leu Thr Leu Gln Ser Gly His Leu Lys Cys 275 280 285 Arg Ala Lys Leu Asp Lys Val Lys Ile Lys Gly Thr Thr Tyr Gly Met 290 295 300 Cys Asp Ser Ala Phe Thr Phe Ser Lys Asn Pro Ala Asp Thr Gly His 305 310 315 320 Gly Thr Val Ile Val Glu Leu Gln Tyr Thr Gly Ser Asn Gly Pro Cys 325 330 335 Arg Val Pro Ile Ser Val Thr Ala Asn Leu Met Asp Leu Thr Pro Val 340 345 350 Gly Arg Leu Val Thr Val Asn Pro Phe Ile Ser Thr Gly Gly Ala Asn 355 360 365 Asn Lys Val Met Val Glu Val Glu Pro Pro Phe Gly Asp Ser Tyr Ile 370 375 380 Val Val Gly Arg Gly Thr Thr Gln Ile Asn Tyr His Trp His Lys Glu 385 390 395 400 Gly Ser Ser Ile Gly Lys Ala Leu Ala Thr Thr Trp Lys Gly Ala Gln 405 410 415 Arg Leu Ala Val Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly 420 425 430 Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly 435 440 445 Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu 450 455 460 Leu Gly Ala Leu Leu Leu Trp Met Gly Leu Gln Ala Arg Asp Arg Ser 465 470 475 480 Ile Ser Leu Thr Leu Leu Ala Val Gly Gly Ile Leu Ile Phe Leu Ala 485 490 495 Thr Ser Val Gln Ala 500 <210> 579 <211> 1416 <212> DNA <213> Flavivirus Yellow fever virus <400> 579 gtgggccccg cctacagcgc ccactgcatc ggcatcaccg acagggactt catcgagggc 60 gtgcacggcg gcacctgggt gagcgccacc ctggagcagg acaagtgcgt gaccgtgatg 120 gcccccgaca agcccagcct ggacatcagc ctggagaccg tggccatcga caggcccgcc 180 gaggtgagga aggtgtgcta caacgccgtg ctgacccacg tgaagatcaa cgacaagtgc 240 cccagcaccg gcgaggccca cctggccgag gagaacgagg gcgacaacgc ctgcaagagg 300 acctacagcg acaggggctg gggcaacggc tgcggcctgt tcggcaaggg cagcatcgtg 360 gcctgcgcca agttcacctg cgccaagagc atgagcctgt tcgaggtgga ccagaccaag 420 atccagtacg tgatcagggc ccagctgcac gtgggcgcca agcaggagaa ctggaacacc 480 gacatcaaga ccctgaagtt cgacgccctg agcggcagcc aggaggtgga gttcatcggc 540 tacggcaagg ccaccctgga gtgccaggtg cagaccgccg tggacttcgg caacagctac 600 atcgccgaga tggagaccga gagctggatc gtggacaggc agtgggccca ggacctgacc 660 ctgccctggc agagcggcag cggcggcgtg tggagggaga tgcaccacct ggtggagttc 720 gagccccccc acgccgccac catcagggtg ctggccctgg gcaaccagga gggcagcctg 780 aagaccgccc tgaccggcgc catgagggtg accaaggaca ccaacgacaa caacctgtac 840 aagctgcacg gcggccacgt gagctgcagg gtgaagctga gcgccctgac cctgaagggc 900 accagctaca agatctgcac cgacaagatg ttcttcgtga agaaccccac cgacaccggc 960 cacggcaccg tggtgatgca ggtgaaggtg agcaagggcg ccccctgcag gatccccgtg 1020 atcgtggccg acgacctgac cgccgccatc aacaagggca tcctggtgac cgtgaacccc 1080 atcgccagca ccaacgacga cgaggtgctg atcgaggtga accccccctt cggcgacagc 1140 tacatcatcg tgggcagggg cgacagcagg ctgacctacc agtggcacaa ggagggcagc 1200 agcatcggca agctgttcac ccagaccatg aagggcgtgg agaggctggc cgtgatgggc 1260 gacaccgcct gggacttcag cagcgccggc ggcttcttca ccagcgtggg caagggcatc 1320 cacaccgtgt tcggcagcgc cttccagggc ctgttcggcg gcctgaactg gatcaccaag 1380 gtgatcatgg gcgccgtgct gatctgggtg ggcatc 1416 <210> 580 <211> 472 <212> PRT <213> Flavivirus Yellow fever virus <400> 580 Val Gly Pro Ala Tyr Ser Ala His Cys Ile Gly Ile Thr Asp Arg Asp 1 5 10 15 Phe Ile Glu Gly Val His Gly Gly Thr Trp Val Ser Ala Thr Leu Glu 20 25 30 Gln Asp Lys Cys Val Thr Val Met Ala Pro Asp Lys Pro Ser Leu Asp 35 40 45 Ile Ser Leu Glu Thr Val Ala Ile Asp Arg Pro Ala Glu Val Arg Lys 50 55 60 Val Cys Tyr Asn Ala Val Leu Thr His Val Lys Ile Asn Asp Lys Cys 65 70 75 80 Pro Ser Thr Gly Glu Ala His Leu Ala Glu Glu Asn Glu Gly Asp Asn 85 90 95 Ala Cys Lys Arg Thr Tyr Ser Asp Arg Gly Trp Gly Asn Gly Cys Gly 100 105 110 Leu Phe Gly Lys Gly Ser Ile Val Ala Cys Ala Lys Phe Thr Cys Ala 115 120 125 Lys Ser Met Ser Leu Phe Glu Val Asp Gln Thr Lys Ile Gln Tyr Val 130 135 140 Ile Arg Ala Gln Leu His Val Gly Ala Lys Gln Glu Asn Trp Asn Thr 145 150 155 160 Asp Ile Lys Thr Leu Lys Phe Asp Ala Leu Ser Gly Ser Gln Glu Val 165 170 175 Glu Phe Ile Gly Tyr Gly Lys Ala Thr Leu Glu Cys Gln Val Gln Thr 180 185 190 Ala Val Asp Phe Gly Asn Ser Tyr Ile Ala Glu Met Glu Thr Glu Ser 195 200 205 Trp Ile Val Asp Arg Gln Trp Ala Gln Asp Leu Thr Leu Pro Trp Gln 210 215 220 Ser Gly Ser Gly Gly Val Trp Arg Glu Met His His Leu Val Glu Phe 225 230 235 240 Glu Pro Pro His Ala Ala Thr Ile Arg Val Leu Ala Leu Gly Asn Gln 245 250 255 Glu Gly Ser Leu Lys Thr Ala Leu Thr Gly Ala Met Arg Val Thr Lys 260 265 270 Asp Thr Asn Asp Asn Asn Leu Tyr Lys Leu His Gly Gly His Val Ser 275 280 285 Cys Arg Val Lys Leu Ser Ala Leu Thr Leu Lys Gly Thr Ser Tyr Lys 290 295 300 Ile Cys Thr Asp Lys Met Phe Phe Val Lys Asn Pro Thr Asp Thr Gly 305 310 315 320 His Gly Thr Val Val Met Gln Val Lys Val Ser Lys Gly Ala Pro Cys 325 330 335 Arg Ile Pro Val Ile Val Ala Asp Asp Leu Thr Ala Ala Ile Asn Lys 340 345 350 Gly Ile Leu Val Thr Val Asn Pro Ile Ala Ser Thr Asn Asp Asp Glu 355 360 365 Val Leu Ile Glu Val Asn Pro Pro Phe Gly Asp Ser Tyr Ile Ile Val 370 375 380 Gly Arg Gly Asp Ser Arg Leu Thr Tyr Gln Trp His Lys Glu Gly Ser 385 390 395 400 Ser Ile Gly Lys Leu Phe Thr Gln Thr Met Lys Gly Val Glu Arg Leu 405 410 415 Ala Val Met Gly Asp Thr Ala Trp Asp Phe Ser Ser Ala Gly Gly Phe 420 425 430 Phe Thr Ser Val Gly Lys Gly Ile His Thr Val Phe Gly Ser Ala Phe 435 440 445 Gln Gly Leu Phe Gly Gly Leu Asn Trp Ile Thr Lys Val Ile Met Gly 450 455 460 Ala Val Leu Ile Trp Val Gly Ile 465 470 <210> 581 <211> 1485 <212> DNA <213> Flavivirus Dengue virus 2 <400> 581 atgaggtgca tcggcatcag caacagggac ttcgtggagg gcgtgagcgg cggcagctgg 60 gtggacatcg tgctggagca cggcagctgc gtgaccacca tggccaagaa caagcccacc 120 ctggacttcg agctgatcaa gaccgaggcc aagcaccccg ccaccctgag gaagtactgc 180 gtggaggcca agctgaccaa caccaccacc gccagcaggt gccccaccca gggcgagccc 240 agcctgaacg aggagcagga caagaggttc gtgtgcaagc acagcatggt ggacaggggc 300 tggggcaacg gctgcggcct gttcggcaag ggcggcatcg tgacctgcgc catgttcacc 360 tgcaagaaga acatggaggg caaggtggtg cagcccgaga acctggagta caccatcgtg 420 atcacccccc acagcggcga ggagaacgcc gtgggcaacg acaccggcaa gcacggcaag 480 gagatcaagg tgacccccca gagcagcatc accgaggccg agctgaccgg ctacggcacc 540 gtgaccatgg agtgcagccc caggaccggc ctggacttca acgagatggt gctgctgcag 600 atggagaaca aggcctggct ggtgcacagg cagtggttcc tggacctgcc cctgccctgg 660 ctgcccggcg ccgacaccca gggcagcaac tggatccaga aggagaccct ggtgaccttc 720 aagaaccccc acgccaagaa gcaggacgtg gtggtgctgg gcagccagga gggcgccatg 780 cacaccgccc tgaccggcgc caccgagatc cagatgagca gcggcaacct gctgttcacc 840 ggccacctga agtgcaggct gaggatggac aagctgcagc tgaagggcat gagctacagc 900 atgtgcaccg gcaagttcaa ggtggtgaag gagatcgccg agacccagca cggcaccatc 960 gtgatcaggg tgcagtacga gggcgacggc agcccctgca agatcccctt cgagatcatg 1020 gacctggaga agaggcacgt gctgggcagg ctgatcaccg tgaaccccat cgtgaccgag 1080 aaggacagcc ccgtgaacat cgaggccgag ccccccttcg gcgacagcta catcatcatc 1140 ggcgtggagc ccggccagct gaagctgagc tggttcaaga agggcagcag catcggccag 1200 atgttcgaga ccaccatgag gggcgccaag aggatggcca tcctgggcga caccgcctgg 1260 gacttcggca gcctgggcgg cgtgttcacc agcatcggca aggccctgca ccaggtgttc 1320 ggcgccatct acggcgccgc cttcagcggc gtgagctgga ccatgaagat cctgatcggc 1380 gtggtgatca cctggatcgg catgaacagc aggagcacca gcctgagcgt gagcctggtg 1440 ctggtgggcg tggtgaccct gtacctgggc gtgatggtgc aggcc 1485 <210> 582 <211> 495 <212> PRT <213> Flavivirus Dengue virus 2 <400> 582 Met Arg Cys Ile Gly Ile Ser Asn Arg Asp Phe Val Glu Gly Val Ser 1 5 10 15 Gly Gly Ser Trp Val Asp Ile Val Leu Glu His Gly Ser Cys Val Thr 20 25 30 Thr Met Ala Lys Asn Lys Pro Thr Leu Asp Phe Glu Leu Ile Lys Thr 35 40 45 Glu Ala Lys His Pro Ala Thr Leu Arg Lys Tyr Cys Val Glu Ala Lys 50 55 60 Leu Thr Asn Thr Thr Thr Ala Ser Arg Cys Pro Thr Gln Gly Glu Pro 65 70 75 80 Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Val Cys Lys His Ser Met 85 90 95 Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Gly 100 105 110 Ile Val Thr Cys Ala Met Phe Thr Cys Lys Lys Asn Met Glu Gly Lys 115 120 125 Val Val Gln Pro Glu Asn Leu Glu Tyr Thr Ile Val Ile Thr Pro His 130 135 140 Ser Gly Glu Glu Asn Ala Val Gly Asn Asp Thr Gly Lys His Gly Lys 145 150 155 160 Glu Ile Lys Val Thr Pro Gln Ser Ser Ile Thr Glu Ala Glu Leu Thr 165 170 175 Gly Tyr Gly Thr Val Thr Met Glu Cys Ser Pro Arg Thr Gly Leu Asp 180 185 190 Phe Asn Glu Met Val Leu Leu Gln Met Glu Asn Lys Ala Trp Leu Val 195 200 205 His Arg Gln Trp Phe Leu Asp Leu Pro Leu Pro Trp Leu Pro Gly Ala 210 215 220 Asp Thr Gln Gly Ser Asn Trp Ile Gln Lys Glu Thr Leu Val Thr Phe 225 230 235 240 Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val Leu Gly Ser Gln 245 250 255 Glu Gly Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Met 260 265 270 Ser Ser Gly Asn Leu Leu Phe Thr Gly His Leu Lys Cys Arg Leu Arg 275 280 285 Met Asp Lys Leu Gln Leu Lys Gly Met Ser Tyr Ser Met Cys Thr Gly 290 295 300 Lys Phe Lys Val Val Lys Glu Ile Ala Glu Thr Gln His Gly Thr Ile 305 310 315 320 Val Ile Arg Val Gln Tyr Glu Gly Asp Gly Ser Pro Cys Lys Ile Pro 325 330 335 Phe Glu Ile Met Asp Leu Glu Lys Arg His Val Leu Gly Arg Leu Ile 340 345 350 Thr Val Asn Pro Ile Val Thr Glu Lys Asp Ser Pro Val Asn Ile Glu 355 360 365 Ala Glu Pro Pro Phe Gly Asp Ser Tyr Ile Ile Ile Gly Val Glu Pro 370 375 380 Gly Gln Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser Ile Gly Gln 385 390 395 400 Met Phe Glu Thr Thr Met Arg Gly Ala Lys Arg Met Ala Ile Leu Gly 405 410 415 Asp Thr Ala Trp Asp Phe Gly Ser Leu Gly Gly Val Phe Thr Ser Ile 420 425 430 Gly Lys Ala Leu His Gln Val Phe Gly Ala Ile Tyr Gly Ala Ala Phe 435 440 445 Ser Gly Val Ser Trp Thr Met Lys Ile Leu Ile Gly Val Val Ile Thr 450 455 460 Trp Ile Gly Met Asn Ser Arg Ser Thr Ser Leu Ser Val Ser Leu Val 465 470 475 480 Leu Val Gly Val Val Thr Leu Tyr Leu Gly Val Met Val Gln Ala 485 490 495 <210> 583 <211> 1479 <212> DNA <213> Flavivirus Dengue virus 3 <400> 583 atgaggtgcg tgggcgtggg caacagggac ttcgtggagg gcctgagcgg cgccacctgg 60 gtggacgtgg tgctggagca cggcggctgc gtgaccacca tggccaagaa caagcccacc 120 ctggacatcg agctgcagaa gaccgaggcc acccagctgg ccaccctgag gaagctgtgc 180 atcgagggca agatcaccaa catcaccacc gacagcaggt gccccaccca gggcgaggcc 240 atcctgcccg aggagcagga ccagaactac gtgtgcaagc acacctacgt ggacaggggc 300 tggggcaacg gctgcggcct gttcggcaag ggcagcctgg tgacctgcgc caagttccag 360 tgcctggaga gcatcgaggg caaggtggtg cagcacgaga acctgaagta caccgtgatc 420 atcaccgtgc acaccggcga ccagcaccag gtgggcaacg agacccaggg cgtgaccgcc 480 gagatcacca gccaggccag caccgccgag gccatcctgc ccgagtacgg caccctgggc 540 ctggagtgca gccccaggac cggcctggac ttcaacgaga tgatcctgct gaccatgaag 600 aacaaggcct ggatggtgca caggcagtgg ttcttcgacc tgcccctgcc ctggaccagc 660 ggcgccacca ccaagacccc cacctggaac aggaaggagc tgctggtgac cttcaagaac 720 gcccacgcca agaagcagga ggtggtggtg ctgggcagcc aggagggcgc catgcacacc 780 gccctgaccg gcgccaccga gatccagacc agcggcggca ccagcatctt cgccggccac 840 ctgaagtgca ggctgaagat ggacaagctg aagctgaagg gcatgagcta cgccatgtgc 900 ctgaacacct tcgtgctgaa gaaggaggtg agcgagaccc agcacggcac catcctgatc 960 aaggtggagt acaagggcga ggacgccccc tgcaagatcc ccttcagcac cgaggacggc 1020 cagggcaagg cccacaacgg caggctgatc accgccaacc ccgtggtgac caagaaggag 1080 gagcccgtga acatcgaggc cgagcccccc ttcggcgaga gcaacatcgt gatcggcatc 1140 ggcgacaagg ccctgaagat caactggtac aggaagggca gcagcatcgg caagatgttc 1200 gaggccaccg ccaggggcgc caggaggatg gccatcctgg gcgacaccgc ctgggacttc 1260 ggcagcgtgg gcggcgtgct gaacagcctg ggcaagatgg tgcaccagat cttcggcagc 1320 gcctacaccg ccctgttcag cggcgtgagc tggatcatga agatcggcat cggcgtgctg 1380 ctgacctgga tcggcctgaa cagcaagaac accagcatga gcttcagctg catcgccatc 1440 ggcatcatca ccctgtacct gggcgtggtg gtgcaggcc 1479 <210> 584 <211> 493 <212> PRT <213> Flavivirus Dengue virus 3 <400> 584 Met Arg Cys Val Gly Val Gly Asn Arg Asp Phe Val Glu Gly Leu Ser 1 5 10 15 Gly Ala Thr Trp Val Asp Val Val Leu Glu His Gly Gly Cys Val Thr 20 25 30 Thr Met Ala Lys Asn Lys Pro Thr Leu Asp Ile Glu Leu Gln Lys Thr 35 40 45 Glu Ala Thr Gln Leu Ala Thr Leu Arg Lys Leu Cys Ile Glu Gly Lys 50 55 60 Ile Thr Asn Ile Thr Thr Asp Ser Arg Cys Pro Thr Gln Gly Glu Ala 65 70 75 80 Ile Leu Pro Glu Glu Gln Asp Gln Asn Tyr Val Cys Lys His Thr Tyr 85 90 95 Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser 100 105 110 Leu Val Thr Cys Ala Lys Phe Gln Cys Leu Glu Ser Ile Glu Gly Lys 115 120 125 Val Val Gln His Glu Asn Leu Lys Tyr Thr Val Ile Ile Thr Val His 130 135 140 Thr Gly Asp Gln His Gln Val Gly Asn Glu Thr Gln Gly Val Thr Ala 145 150 155 160 Glu Ile Thr Ser Gln Ala Ser Thr Ala Glu Ala Ile Leu Pro Glu Tyr 165 170 175 Gly Thr Leu Gly Leu Glu Cys Ser Pro Arg Thr Gly Leu Asp Phe Asn 180 185 190 Glu Met Ile Leu Leu Thr Met Lys Asn Lys Ala Trp Met Val His Arg 195 200 205 Gln Trp Phe Phe Asp Leu Pro Leu Pro Trp Thr Ser Gly Ala Thr Thr 210 215 220 Lys Thr Pro Thr Trp Asn Arg Lys Glu Leu Leu Val Thr Phe Lys Asn 225 230 235 240 Ala His Ala Lys Lys Gln Glu Val Val Val Leu Gly Ser Gln Glu Gly 245 250 255 Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Thr Ser Gly 260 265 270 Gly Thr Ser Ile Phe Ala Gly His Leu Lys Cys Arg Leu Lys Met Asp 275 280 285 Lys Leu Lys Leu Lys Gly Met Ser Tyr Ala Met Cys Leu Asn Thr Phe 290 295 300 Val Leu Lys Lys Glu Val Ser Glu Thr Gln His Gly Thr Ile Leu Ile 305 310 315 320 Lys Val Glu Tyr Lys Gly Glu Asp Ala Pro Cys Lys Ile Pro Phe Ser 325 330 335 Thr Glu Asp Gly Gln Gly Lys Ala His Asn Gly Arg Leu Ile Thr Ala 340 345 350 Asn Pro Val Val Thr Lys Lys Glu Glu Pro Val Asn Ile Glu Ala Glu 355 360 365 Pro Pro Phe Gly Glu Ser Asn Ile Val Ile Gly Ile Gly Asp Lys Ala 370 375 380 Leu Lys Ile Asn Trp Tyr Arg Lys Gly Ser Ser Ile Gly Lys Met Phe 385 390 395 400 Glu Ala Thr Ala Arg Gly Ala Arg Arg Met Ala Ile Leu Gly Asp Thr 405 410 415 Ala Trp Asp Phe Gly Ser Val Gly Gly Val Leu Asn Ser Leu Gly Lys 420 425 430 Met Val His Gln Ile Phe Gly Ser Ala Tyr Thr Ala Leu Phe Ser Gly 435 440 445 Val Ser Trp Ile Met Lys Ile Gly Ile Gly Val Leu Leu Thr Trp Ile 450 455 460 Gly Leu Asn Ser Lys Asn Thr Ser Met Ser Phe Ser Cys Ile Ala Ile 465 470 475 480 Gly Ile Ile Thr Leu Tyr Leu Gly Val Val Val Gln Ala 485 490 <210> 585 <211> 216 <212> DNA <213> Flavivirus Dengue virus 4 <400> 585 ttcggcagcg tgggcggcct gttcaccagc ctgggcaagg ccgtgcacca ggtgttcggc 60 agcgtgtaca ccaccatgtt cggcggcgtg agctggatga tcaggatcct gatcggcttc 120 ctggtgctgt ggatcggcac caacagcagg aacaccagca tggccatgac ctgcatcgcc 180 gtgggcggca tcaccctgtt cctgggcttc accgtg 216 <210> 586 <211> 72 <212> PRT <213> Flavivirus Dengue virus 4 <400> 586 Phe Gly Ser Val Gly Gly Leu Phe Thr Ser Leu Gly Lys Ala Val His 1 5 10 15 Gln Val Phe Gly Ser Val Tyr Thr Thr Met Phe Gly Gly Val Ser Trp 20 25 30 Met Ile Arg Ile Leu Ile Gly Phe Leu Val Leu Trp Ile Gly Thr Asn 35 40 45 Ser Arg Asn Thr Ser Met Ala Met Thr Cys Ile Ala Val Gly Gly Ile 50 55 60 Thr Leu Phe Leu Gly Phe Thr Val 65 70 <210> 587 <211> 1503 <212> DNA <213> Flavivirus Murray Valley encephalitis virus <400> 587 ttcaactgcc tgggcatgag cagcagggac ttcatcgagg gcgccagcgg cgccacctgg 60 gtggacctgg tgctggaggg cgacagctgc atcaccatca tggccgccga caagcccacc 120 ctggacatca ggatgatgaa catcgaggcc accaacctgg ccctggtgag gaactactgc 180 tacgccgcca ccgtgagcga cgtgagcacc gtgagcaact gccccaccac cggcgagagc 240 cacaacacca agagggccga ccacaactac ctgtgcaaga ggggcgtgac cgacaggggc 300 tggggcaacg gctgcggcct gttcggcaag ggcagcatcg acacctgcgc caagttcacc 360 tgcagcaaca gcgccgccgg caggctgatc ctgcccgagg acatcaagta cgaggtgggc 420 gtgttcgtgc acggcagcac cgacagcacc agccacggca actacagcac ccagatcggc 480 gccaaccagg ccgtgaggtt caccatcagc cccaacgccc ccgccatcac cgccaagatg 540 ggcgactacg gcgaggtgac cgtggagtgc gagcccagga gcggcctgaa caccgaggcc 600 tactacgtga tgaccatcgg caccaagcac ttcctggtgc acagggagtg gttcaacgac 660 ctgctgctgc cctggaccag ccccgccagc accgagtgga ggaacaggga gatcctggtg 720 gagttcgagg agccccacgc caccaagcag agcgtggtgg ccctgggcag ccaggagggc 780 gccctgcacc aggccctggc cggcgccatc cccgtggagt tcagcagcag caccctgaag 840 ctgaccagcg gccacctgaa gtgcagggtg aagatggaga agctgaagct gaagggcacc 900 acctacggca tgtgcaccga gaagttcacc ttcagcaaga accccgccga caccggccac 960 ggcaccgtgg tgctggagct gcagtacacc ggcagcgacg gcccctgcaa gatccccatc 1020 agcagcgtgg ccagcctgaa cgacatgacc cccgtgggca ggatggtgac cgccaacccc 1080 tacgtggcca gcagcaccgc caacgccaag gtgctggtgg agatcgagcc ccccttcggc 1140 gacagctaca tcgtggtggg caggggcgac aagcagatca accaccactg gcacaaggag 1200 ggcagcagca tcggcaaggc cttcagcacc accctgaagg gcgcccagag gctggccgcc 1260 ctgggcgaca ccgcctggga cttcggcagc gtgggcggcg tgttcaacag catcggcaag 1320 gccgtgcacc aggtgttcgg cggcgccttc aggaccctgt tcggcggcat gagctggatc 1380 agccccggcc tgctgggcgc cctgctgctg tggatgggcg tgaacgccag ggacaagagc 1440 atcgccctgg ccttcctggc caccggcggc gtgctgctgt tcctggccac caacgtgcac 1500 gcc 1503 <210> 588 <211> 501 <212> PRT <213> Flavivirus Murray Valley encephalitis virus <400> 588 Phe Asn Cys Leu Gly Met Ser Ser Arg Asp Phe Ile Glu Gly Ala Ser 1 5 10 15 Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Ile Thr 20 25 30 Ile Met Ala Ala Asp Lys Pro Thr Leu Asp Ile Arg Met Met Asn Ile 35 40 45 Glu Ala Thr Asn Leu Ala Leu Val Arg Asn Tyr Cys Tyr Ala Ala Thr 50 55 60 Val Ser Asp Val Ser Thr Val Ser Asn Cys Pro Thr Thr Gly Glu Ser 65 70 75 80 His Asn Thr Lys Arg Ala Asp His Asn Tyr Leu Cys Lys Arg Gly Val 85 90 95 Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser 100 105 110 Ile Asp Thr Cys Ala Lys Phe Thr Cys Ser Asn Ser Ala Ala Gly Arg 115 120 125 Leu Ile Leu Pro Glu Asp Ile Lys Tyr Glu Val Gly Val Phe Val His 130 135 140 Gly Ser Thr Asp Ser Thr Ser His Gly Asn Tyr Ser Thr Gln Ile Gly 145 150 155 160 Ala Asn Gln Ala Val Arg Phe Thr Ile Ser Pro Asn Ala Pro Ala Ile 165 170 175 Thr Ala Lys Met Gly Asp Tyr Gly Glu Val Thr Val Glu Cys Glu Pro 180 185 190 Arg Ser Gly Leu Asn Thr Glu Ala Tyr Tyr Val Met Thr Ile Gly Thr 195 200 205 Lys His Phe Leu Val His Arg Glu Trp Phe Asn Asp Leu Leu Leu Pro 210 215 220 Trp Thr Ser Pro Ala Ser Thr Glu Trp Arg Asn Arg Glu Ile Leu Val 225 230 235 240 Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Val Ala Leu Gly 245 250 255 Ser Gln Glu Gly Ala Leu His Gln Ala Leu Ala Gly Ala Ile Pro Val 260 265 270 Glu Phe Ser Ser Ser Thr Leu Lys Leu Thr Ser Gly His Leu Lys Cys 275 280 285 Arg Val Lys Met Glu Lys Leu Lys Leu Lys Gly Thr Thr Tyr Gly Met 290 295 300 Cys Thr Glu Lys Phe Thr Phe Ser Lys Asn Pro Ala Asp Thr Gly His 305 310 315 320 Gly Thr Val Val Leu Glu Leu Gln Tyr Thr Gly Ser Asp Gly Pro Cys 325 330 335 Lys Ile Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val 340 345 350 Gly Arg Met Val Thr Ala Asn Pro Tyr Val Ala Ser Ser Thr Ala Asn 355 360 365 Ala Lys Val Leu Val Glu Ile Glu Pro Pro Phe Gly Asp Ser Tyr Ile 370 375 380 Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Glu 385 390 395 400 Gly Ser Ser Ile Gly Lys Ala Phe Ser Thr Thr Leu Lys Gly Ala Gln 405 410 415 Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly 420 425 430 Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly 435 440 445 Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Ser Pro Gly Leu 450 455 460 Leu Gly Ala Leu Leu Leu Trp Met Gly Val Asn Ala Arg Asp Lys Ser 465 470 475 480 Ile Ala Leu Ala Phe Leu Ala Thr Gly Gly Val Leu Leu Phe Leu Ala 485 490 495 Thr Asn Val His Ala 500 <210> 589 <211> 1491 <212> DNA <213> Flavivirus Powassan virus <400> 589 accaggtgca cccacctgga gaacagggac ttcgtgaccg gcacccaggg caccaccagg 60 gtgagcctgg tgctggagct gggcggctgc gtgaccatca ccgccgaggg caagcccagc 120 atcgacgtgt ggctggagga catcttccag gagagccccg ccgagaccag ggagtactgc 180 ctgcacgcca agctgaccaa caccaaggtg gaggccaggt gccccaccac cggccccgcc 240 accctgcccg aggagcacca ggccaacatg gtgtgcaaga gggaccagag cgacaggggc 300 tggggcaacc actgcggctt cttcggcaag ggcagcatcg tggcctgcgc caagttcgag 360 tgcgaggagg ccaagaaggc catgggccac gtgtacgaca gcaccaagat cacctacgtg 420 gtgaaggtgg agccccacac cggcgactac ctggccgcca acgagaccaa cagcaacagg 480 aagagcgccc agttcaccgt ggccagcgag aaggtgatcc tgaggctggg cgactacggc 540 gacgtgagcc tgacctgcaa ggtggccagc ggcatcgacg tggcccagac cgtggtgatg 600 agcctggaca gcagcaagga ccacctgccc agcgcctggc aggtgcacag ggactggttc 660 gaggacctgg ccctgccctg gaagcacaag gacaaccagg actggaacag cgtggagaag 720 ctggtggagt tcggcccccc ccacgccgtg aagatggacg tgttcaacct gggcgaccag 780 accgccgtgc tgctgaagag cctggccggc gtgcccctgg ccagcgtgga gggccagaag 840 taccacctga agagcggcca cgtgacctgc gacgtgggcc tggagaagct gaagctgaag 900 ggcaccacct acagcatgtg cgacaaggcc aagttcaagt ggaagagggt gcccgtggac 960 agcggccacg acaccgtggt gatggaggtg agctacaccg gcagcgacaa gccctgcagg 1020 atccccgtga gggccgtggc ccacggcgtg cccgccgtga acgtggccat gctgatcacc 1080 cccaacccca ccatcgagac caacggcggc ggcttcatcg agatgcagct gccccccggc 1140 gacaacatca tctacgtggg cgacctgagc cagcagtggt tccagaaggg cagcaccatc 1200 ggcaggatgt tcgagaagac caggaggggc ctggagaggc tgagcgtggt gggcgagcac 1260 gcctgggact tcggcagcgt gggcggcgtg ctgagcagcg tgggcaaggc catccacacc 1320 gtgctgggcg gcgccttcaa caccctgttc ggcggcgtgg gcttcatccc caagatgctg 1380 ctgggcgtgg ccctggtgtg gctgggcctg aacgccagga accccaccat gagcatgacc 1440 ttcctggccg tgggcgccct gaccctgatg atgaccatgg gcgtgggcgc c 1491 <210> 590 <211> 497 <212> PRT <213> Flavivirus Powassan virus <400> 590 Thr Arg Cys Thr His Leu Glu Asn Arg Asp Phe Val Thr Gly Thr Gln 1 5 10 15 Gly Thr Thr Arg Val Ser Leu Val Leu Glu Leu Gly Gly Cys Val Thr 20 25 30 Ile Thr Ala Glu Gly Lys Pro Ser Ile Asp Val Trp Leu Glu Asp Ile 35 40 45 Phe Gln Glu Ser Pro Ala Glu Thr Arg Glu Tyr Cys Leu His Ala Lys 50 55 60 Leu Thr Asn Thr Lys Val Glu Ala Arg Cys Pro Thr Thr Gly Pro Ala 65 70 75 80 Thr Leu Pro Glu Glu His Gln Ala Asn Met Val Cys Lys Arg Asp Gln 85 90 95 Ser Asp Arg Gly Trp Gly Asn His Cys Gly Phe Phe Gly Lys Gly Ser 100 105 110 Ile Val Ala Cys Ala Lys Phe Glu Cys Glu Glu Ala Lys Lys Ala Met 115 120 125 Gly His Val Tyr Asp Ser Thr Lys Ile Thr Tyr Val Val Lys Val Glu 130 135 140 Pro His Thr Gly Asp Tyr Leu Ala Ala Asn Glu Thr Asn Ser Asn Arg 145 150 155 160 Lys Ser Ala Gln Phe Thr Val Ala Ser Glu Lys Val Ile Leu Arg Leu 165 170 175 Gly Asp Tyr Gly Asp Val Ser Leu Thr Cys Lys Val Ala Ser Gly Ile 180 185 190 Asp Val Ala Gln Thr Val Val Met Ser Leu Asp Ser Ser Lys Asp His 195 200 205 Leu Pro Ser Ala Trp Gln Val His Arg Asp Trp Phe Glu Asp Leu Ala 210 215 220 Leu Pro Trp Lys His Lys Asp Asn Gln Asp Trp Asn Ser Val Glu Lys 225 230 235 240 Leu Val Glu Phe Gly Pro Pro His Ala Val Lys Met Asp Val Phe Asn 245 250 255 Leu Gly Asp Gln Thr Ala Val Leu Leu Lys Ser Leu Ala Gly Val Pro 260 265 270 Leu Ala Ser Val Glu Gly Gln Lys Tyr His Leu Lys Ser Gly His Val 275 280 285 Thr Cys Asp Val Gly Leu Glu Lys Leu Lys Leu Lys Gly Thr Thr Tyr 290 295 300 Ser Met Cys Asp Lys Ala Lys Phe Lys Trp Lys Arg Val Pro Val Asp 305 310 315 320 Ser Gly His Asp Thr Val Val Met Glu Val Ser Tyr Thr Gly Ser Asp 325 330 335 Lys Pro Cys Arg Ile Pro Val Arg Ala Val Ala His Gly Val Pro Ala 340 345 350 Val Asn Val Ala Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Thr Asn 355 360 365 Gly Gly Gly Phe Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile 370 375 380 Tyr Val Gly Asp Leu Ser Gln Gln Trp Phe Gln Lys Gly Ser Thr Ile 385 390 395 400 Gly Arg Met Phe Glu Lys Thr Arg Arg Gly Leu Glu Arg Leu Ser Val 405 410 415 Val Gly Glu His Ala Trp Asp Phe Gly Ser Val Gly Gly Val Leu Ser 420 425 430 Ser Val Gly Lys Ala Ile His Thr Val Leu Gly Gly Ala Phe Asn Thr 435 440 445 Leu Phe Gly Gly Val Gly Phe Ile Pro Lys Met Leu Leu Gly Val Ala 450 455 460 Leu Val Trp Leu Gly Leu Asn Ala Arg Asn Pro Thr Met Ser Met Thr 465 470 475 480 Phe Leu Ala Val Gly Ala Leu Thr Leu Met Met Thr Met Gly Val Gly 485 490 495 Ala <210> 591 <211> 1692 <212> DNA <213> Alphainfluenzavirus Influenza A virus H5N1 <400> 591 atggagagga tcgtgctgct gctggccatc gtgagcctgg tgaagagcga ccagatctgc 60 atcggctacc acgccaacaa gagcaccaag caggtggaca ccatcatgga gaagaacgtg 120 accgtgaccc acgcccagga catcctggag aggacccaca acggcaagct gtgcagcctg 180 aacggcgtga agcccctgat cctgagggac tgcagcgtgg ccggctggct gctgggcaac 240 cccatgtgcg acgagttcct gaacgtgccc gagtggagct acatcgtgga gaaggacaac 300 cccatcaaca gcctgtgcta ccccggcgac ttcaacgact acgaggagct gaagcacctg 360 ctgagcagca ccaaccactt cgagaagatc cagatcatcc ccaggagcag ctggagcaac 420 cacgacgcca gcagcggcgt gagcagcgcc tgcccctaca tcggcaggag cagcttcttc 480 aggaacgtgg tgtggctgat caagaaggac aacgcctacc ccaccatcaa gaggagctac 540 aacaacacca accaggagga cctgctgatc ctgtggggca tccaccaccc caacgacgcc 600 gccgagcaga ccaagctgta ccagaacccc accacctacg tgagcgtggg caccagcacc 660 ctgaaccaga ggagcatccc cgagatcgcc accaggccca aggtgaacgg ccagagcggc 720 aggatggagt tcttctggac catcctgaag cccaacgacg ccatcaactt cgagagcaac 780 ggcaacttca tcgcccccga gtacgcctac aagatcgtga agaagggcga cagcgccatc 840 atgaagagcg gcctggccta cggcaactgc gacaccaagt gccagacccc cgtgggcgcc 900 atcaacagca gcatgccctt ccacaacatc cacccccaca ccatcggcga gtgccccaag 960 tacgtgaaga gcgacaggct ggtgctggcc accggcctga ggaacgtgcc ccagaggaag 1020 aagaggggcc tgttcggcgc catcgccggc ttcatcgagg gcggctggca gggcatggtg 1080 gacggctggt acggctacca ccacagcaac gagcagggca gcggctacgc cgccgacaag 1140 gagagcaccc agaaggccat cgacggcatc accaacaagg tgaacagcat catcgacaag 1200 atgaacaccc agttcaaggc cgtgggcaag gagttcaaca acctggagag gagggtggag 1260 aacctgaaca agaagatgga ggacggcttc ctggacgtgt ggacctacaa cgtggagctg 1320 ctggtgctga tggagaacga gaggaccctg gacttccacg acagcaacgt gaagaacctg 1380 tacgacaagg tgaggctgca gctgaaggac aacgccaggg agctgggcaa cggctgcttc 1440 gagttctacc acaagtgcga caacgagtgc atggagagcg tgaggaacgg cacctacgac 1500 tacccccagt acagcgagga ggccaggctg aacagggagg agatcagcgg cgtgaagctg 1560 gagagcatgg gcgtgtacca gatcctgagc atctacagca ccgtggccag cagcctggcc 1620 ctggccatca tgatcgccgg cctgagcttc tggatgtgca gcaacggcag cctgcagtgc 1680 aggatctgca tc 1692 <210> 592 <211> 564 <212> PRT <213> Alphainfluenzavirus Influenza A virus H5N1 <400> 592 Met Glu Arg Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser 1 5 10 15 Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Lys Ser Thr Lys Gln Val 20 25 30 Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile 35 40 45 Leu Glu Arg Thr His Asn Gly Lys Leu Cys Ser Leu Asn Gly Val Lys 50 55 60 Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 65 70 75 80 Pro Met Cys Asp Glu Phe Leu Asn Val Pro Glu Trp Ser Tyr Ile Val 85 90 95 Glu Lys Asp Asn Pro Ile Asn Ser Leu Cys Tyr Pro Gly Asp Phe Asn 100 105 110 Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Thr Asn His Phe Glu 115 120 125 Lys Ile Gln Ile Ile Pro Arg Ser Ser Trp Ser Asn His Asp Ala Ser 130 135 140 Ser Gly Val Ser Ser Ala Cys Pro Tyr Ile Gly Arg Ser Ser Phe Phe 145 150 155 160 Arg Asn Val Val Trp Leu Ile Lys Lys Asp Asn Ala Tyr Pro Thr Ile 165 170 175 Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp 180 185 190 Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln 195 200 205 Asn Pro Thr Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Gln Arg 210 215 220 Ser Ile Pro Glu Ile Ala Thr Arg Pro Lys Val Asn Gly Gln Ser Gly 225 230 235 240 Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn 245 250 255 Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile 260 265 270 Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Gly Leu Ala Tyr Gly 275 280 285 Asn Cys Asp Thr Lys Cys Gln Thr Pro Val Gly Ala Ile Asn Ser Ser 290 295 300 Met Pro Phe His Asn Ile His Pro His Thr Ile Gly Glu Cys Pro Lys 305 310 315 320 Tyr Val Lys Ser Asp Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Val 325 330 335 Pro Gln Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile 340 345 350 Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His 355 360 365 Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln 370 375 380 Lys Ala Ile Asp Gly Ile Thr Asn Lys Val Asn Ser Ile Ile Asp Lys 385 390 395 400 Met Asn Thr Gln Phe Lys Ala Val Gly Lys Glu Phe Asn Asn Leu Glu 405 410 415 Arg Arg Val Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp 420 425 430 Val Trp Thr Tyr Asn Val Glu Leu Leu Val Leu Met Glu Asn Glu Arg 435 440 445 Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val 450 455 460 Arg Leu Gln Leu Lys Asp Asn Ala Arg Glu Leu Gly Asn Gly Cys Phe 465 470 475 480 Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn 485 490 495 Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Asn Arg 500 505 510 Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln Ile 515 520 525 Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met 530 535 540 Ile Ala Gly Leu Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys 545 550 555 560 Arg Ile Cys Ile <210> 593 <211> 1680 <212> DNA <213> Alphainfluenzavirus Influenza A virus H7N9 <400> 593 atgaacaccc agatcctggt gttcgccctg atcgccatca tccccaccaa cgccgacaag 60 atctgcctgg gccaccacgc cgtgagcaac ggcaccaagg tgaacaccct gaccgagagg 120 ggcgtggagg tggtgaacgc caccgagacc gtggagagga ccaacatccc caggatctgc 180 agcaagggca agaggaccgt ggacctgggc cagtgcggcc tgctgggcac catcaccggc 240 cccccccagt gcgaccagtt cctggagttc agcgccgacc tgatcatcga gaggagggag 300 ggcagcgacg tgtgctaccc cggcaagttc gtgaacgagg aggccctgag gcagatcctg 360 agggagagcg gcggcatcga caaggaggcc atgggcttca cctacagcgg catcaggacc 420 aacggcgcca ccagcgcctg caggaggagc ggcagcagct tctacgccga gatgaagtgg 480 ctgctgagca acaccgacaa cgccgccttc ccccagatga ccaagagcta caagaacacc 540 aggaagagcc ccgccctgat cgtgtggggc atccaccaca gcgtgagcac cgccgagcag 600 accaagctgt acggcagcgg caacaagctg gtgaccgtgg gcagcagcaa ctaccagcag 660 agcttcgtgc ccagccccgg cgccaggccc caggtgaacg gcatcagcgg caggatcgac 720 ttccactggc tgatgctgaa ccccaacgac accgtgacct tcagcttcaa cggcgccttc 780 atcgcccccg acagggccag cttcctgagg ggcaagagca tgggcatcca gagcggcgtg 840 caggtggacg ccaactgcga gggcgactgc taccacagcg gcggcaccat catcagcaac 900 ctgcccttcc agaacatcga cagcagggcc gtgggcaagt gccccaggta cgtgaagcag 960 aggagcctgc tgctggccac cggcatgaag aacgtgcccg agatccccaa gggcaggggc 1020 ctgttcggcg ccatcgccgg cttcatcgag aacggctggg agggcctgat cgacggctgg 1080 tacggcttca ggcaccagaa cgcccagggc gagggcaccg ccgccgacta caagagcacc 1140 cagagcgcca tcgaccagat caccggcaag ctgaacaggc tgatcgagaa gaccaaccag 1200 cagttcgagc tgatcgacaa cgagttcaac gaggtggaga agcagatcgg caacgtgatc 1260 aactggacca gggacagcat caccgaggtg tggagctaca acgccgagct gctggtggcc 1320 atggagaacc agcacaccat cgacctggcc gacagcgaga tggacaagct gtacgagagg 1380 gtgaagaggc agctgaggga gaacgccgag gaggacggca ccggctgctt cgagatcttc 1440 cacaagtgcg acgacgactg catggccagc atcaggaaca acacctacga ccacagcaag 1500 tacagggagg aggccatgca gaacaggatc cagatcgacc ccgtgaagct gagcagcggc 1560 tacaaggacg tgatcctgtg gttcagcttc ggcgccagct gcttcatcct gctggccatc 1620 gtgatgggcc tggtgttcat ctgcgtgaag aacggcaaca tgaggtgcac catctgcatc 1680 <210> 594 <211> 560 <212> PRT <213> Alphainfluenzavirus Influenza A virus H7N9 <400> 594 Met Asn Thr Gln Ile Leu Val Phe Ala Leu Ile Ala Ile Ile Pro Thr 1 5 10 15 Asn Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr 20 25 30 Lys Val Asn Thr Leu Thr Glu Arg Gly Val Glu Val Val Asn Ala Thr 35 40 45 Glu Thr Val Glu Arg Thr Asn Ile Pro Arg Ile Cys Ser Lys Gly Lys 50 55 60 Arg Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Ile Thr Gly 65 70 75 80 Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asp Leu Ile Ile 85 90 95 Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr Pro Gly Lys Phe Val Asn 100 105 110 Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu Ser Gly Gly Ile Asp Lys 115 120 125 Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile Arg Thr Asn Gly Ala Thr 130 135 140 Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe Tyr Ala Glu Met Lys Trp 145 150 155 160 Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe Pro Gln Met Thr Lys Ser 165 170 175 Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu Ile Val Trp Gly Ile His 180 185 190 His Ser Val Ser Thr Ala Glu Gln Thr Lys Leu Tyr Gly Ser Gly Asn 195 200 205 Lys Leu Val Thr Val Gly Ser Ser Asn Tyr Gln Gln Ser Phe Val Pro 210 215 220 Ser Pro Gly Ala Arg Pro Gln Val Asn Gly Ile Ser Gly Arg Ile Asp 225 230 235 240 Phe His Trp Leu Met Leu Asn Pro Asn Asp Thr Val Thr Phe Ser Phe 245 250 255 Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys 260 265 270 Ser Met Gly Ile Gln Ser Gly Val Gln Val Asp Ala Asn Cys Glu Gly 275 280 285 Asp Cys Tyr His Ser Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln 290 295 300 Asn Ile Asp Ser Arg Ala Val Gly Lys Cys Pro Arg Tyr Val Lys Gln 305 310 315 320 Arg Ser Leu Leu Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ile Pro 325 330 335 Lys Gly Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly 340 345 350 Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ala 355 360 365 Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile 370 375 380 Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln 385 390 395 400 Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn Glu Val Glu Lys Gln Ile 405 410 415 Gly Asn Val Ile Asn Trp Thr Arg Asp Ser Ile Thr Glu Val Trp Ser 420 425 430 Tyr Asn Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp 435 440 445 Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr Glu Arg Val Lys Arg Gln 450 455 460 Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr Gly Cys Phe Glu Ile Phe 465 470 475 480 His Lys Cys Asp Asp Asp Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr 485 490 495 Asp His Ser Lys Tyr Arg Glu Glu Ala Met Gln Asn Arg Ile Gln Ile 500 505 510 Asp Pro Val Lys Leu Ser Ser Gly Tyr Lys Asp Val Ile Leu Trp Phe 515 520 525 Ser Phe Gly Ala Ser Cys Phe Ile Leu Leu Ala Ile Val Met Gly Leu 530 535 540 Val Phe Ile Cys Val Lys Asn Gly Asn Met Arg Cys Thr Ile Cys Ile 545 550 555 560 <210> 595 <211> 1821 <212> DNA <213> Morbillivirus Canine Distemper Virus <400> 595 atgctgagct accaggacaa ggtgggcgcc ttctacaagg acaacgccag ggccaacagc 60 agcaagctga gcctggtgac cgaggagcag ggcggcagga ggccccccta cctgctgttc 120 gtgctgctga tcctgctggt gggcatcatg gccctgctgg ccatcaccgg cgtgaggttc 180 caccaggtga gcaccagcaa catggagttc agcaggctgc tgaaggagga catggagaag 240 agcgaggccg tgcaccacca ggtgatcgac gtgctgaccc ccctgttcaa gatcatcggc 300 gacgaggtgg gcctgaggct gccccagaag ctgaacgaga tcaagcagtt catcctgcag 360 aagaccaact tcttcaaccc caacagggag ttcgacttca gggacctgca ctggtgcatc 420 aaccccccca gcaagatcaa ggtgaacttc accaactact gcgacaccat cggcatcagg 480 aagagcatcg ccagcgccgc caaccccatc ctgctgagcg cccacaccgg cggcaggggc 540 gacatcttcc ccccctacag gtgcagcggc gccaccacca gcgtgggcag ggtgttcccc 600 ctgagcgtga gcctgagcat gagcctgatc agcaggacca gcgagatcat caacatgctg 660 accgccatca gcgacggcgt gtacggcaag acctacctgc tggtgcccga ctacatcgag 720 ggcgagttcg acacccagaa gatcagggtg ttcgagatcg gcttcatcaa gaggtggctg 780 aacgacatgc ccctgctgca gaccaccaac tacatggtgc tgcccgagaa cagcaaggcc 840 aaggtgtgca ccatcgccgt gggcgagctg accctggcca gcctgtgcgt ggacgagagc 900 accatcctgc tgtaccacga cagcaacggc agccaggacg gcatcctggt ggtgaccctg 960 ggcatcttcg gcgccacccc catggaccag gtggaggagg tgatccccgt ggcccacccc 1020 agcgtggaga agatccacat caccaaccac aggggcttca tcaaggacag catcgccacc 1080 tggatggtgc ccgccctggt gagcgagaag caggaggagc agaagagctg cctggagagc 1140 gcctgccaga ggaagagcta ccccatgtgc aaccagacca gctgggagcc cttcggcggc 1200 ggccagctgc ccagctacgg caggctgacc ctgcccctgg accccagcat cgacctgcag 1260 ctgaacatca gcttcaccta cggccccgtg atcctgaacg gcaacggcat ggactactac 1320 gagagccccc tgctgggcag cggctggctg accatccccc ccaagaacgg caccgtgctg 1380 ggcctgatca acaaggccgg caggggcgac cagttcaccg tgatccccca cgtgctgacc 1440 ttcgccccca gggagagcag cggcaactgc tacctgccca tccagaccag ccagatcatg 1500 gacaaggacg tgctgaccga gagcaacctg gtggtgctgc ccacccagaa cttcaggtac 1560 gtgatcgcca cctacgacat cagcaggggc gaccacgcca tcgtgtacta cgtgtacgac 1620 cccatcagga ccatcagcta cacccacccc ttcaggctga ccaccaaggg caggcccgac 1680 ttcctgagga tcgagtgctt cgtgtgggac gacgacctgt ggtgccacca gttctacagg 1740 ttcgagaccg acagcaccaa cagcaccacc agcgtggaga acctggtgag gatcaggttc 1800 agctgcagca ggagcaagcc c 1821 <210> 596 <211> 607 <212> PRT <213> Morbillivirus Canine Distemper Virus <400> 596 Met Leu Ser Tyr Gln Asp Lys Val Gly Ala Phe Tyr Lys Asp Asn Ala 1 5 10 15 Arg Ala Asn Ser Ser Lys Leu Ser Leu Val Thr Glu Glu Gln Gly Gly 20 25 30 Arg Arg Pro Pro Tyr Leu Leu Phe Val Leu Leu Ile Leu Leu Val Gly 35 40 45 Ile Met Ala Leu Leu Ala Ile Thr Gly Val Arg Phe His Gln Val Ser 50 55 60 Thr Ser Asn Met Glu Phe Ser Arg Leu Leu Lys Glu Asp Met Glu Lys 65 70 75 80 Ser Glu Ala Val His His Gln Val Ile Asp Val Leu Thr Pro Leu Phe 85 90 95 Lys Ile Ile Gly Asp Glu Val Gly Leu Arg Leu Pro Gln Lys Leu Asn 100 105 110 Glu Ile Lys Gln Phe Ile Leu Gln Lys Thr Asn Phe Phe Asn Pro Asn 115 120 125 Arg Glu Phe Asp Phe Arg Asp Leu His Trp Cys Ile Asn Pro Pro Ser 130 135 140 Lys Ile Lys Val Asn Phe Thr Asn Tyr Cys Asp Thr Ile Gly Ile Arg 145 150 155 160 Lys Ser Ile Ala Ser Ala Ala Asn Pro Ile Leu Leu Ser Ala His Thr 165 170 175 Gly Gly Arg Gly Asp Ile Phe Pro Pro Tyr Arg Cys Ser Gly Ala Thr 180 185 190 Thr Ser Val Gly Arg Val Phe Pro Leu Ser Val Ser Leu Ser Met Ser 195 200 205 Leu Ile Ser Arg Thr Ser Glu Ile Ile Asn Met Leu Thr Ala Ile Ser 210 215 220 Asp Gly Val Tyr Gly Lys Thr Tyr Leu Leu Val Pro Asp Tyr Ile Glu 225 230 235 240 Gly Glu Phe Asp Thr Gln Lys Ile Arg Val Phe Glu Ile Gly Phe Ile 245 250 255 Lys Arg Trp Leu Asn Asp Met Pro Leu Leu Gln Thr Thr Asn Tyr Met 260 265 270 Val Leu Pro Glu Asn Ser Lys Ala Lys Val Cys Thr Ile Ala Val Gly 275 280 285 Glu Leu Thr Leu Ala Ser Leu Cys Val Asp Glu Ser Thr Ile Leu Leu 290 295 300 Tyr His Asp Ser Asn Gly Ser Gln Asp Gly Ile Leu Val Val Thr Leu 305 310 315 320 Gly Ile Phe Gly Ala Thr Pro Met Asp Gln Val Glu Glu Val Ile Pro 325 330 335 Val Ala His Pro Ser Val Glu Lys Ile His Ile Thr Asn His Arg Gly 340 345 350 Phe Ile Lys Asp Ser Ile Ala Thr Trp Met Val Pro Ala Leu Val Ser 355 360 365 Glu Lys Gln Glu Glu Gln Lys Ser Cys Leu Glu Ser Ala Cys Gln Arg 370 375 380 Lys Ser Tyr Pro Met Cys Asn Gln Thr Ser Trp Glu Pro Phe Gly Gly 385 390 395 400 Gly Gln Leu Pro Ser Tyr Gly Arg Leu Thr Leu Pro Leu Asp Pro Ser 405 410 415 Ile Asp Leu Gln Leu Asn Ile Ser Phe Thr Tyr Gly Pro Val Ile Leu 420 425 430 Asn Gly Asn Gly Met Asp Tyr Tyr Glu Ser Pro Leu Leu Gly Ser Gly 435 440 445 Trp Leu Thr Ile Pro Pro Lys Asn Gly Thr Val Leu Gly Leu Ile Asn 450 455 460 Lys Ala Gly Arg Gly Asp Gln Phe Thr Val Ile Pro His Val Leu Thr 465 470 475 480 Phe Ala Pro Arg Glu Ser Ser Gly Asn Cys Tyr Leu Pro Ile Gln Thr 485 490 495 Ser Gln Ile Met Asp Lys Asp Val Leu Thr Glu Ser Asn Leu Val Val 500 505 510 Leu Pro Thr Gln Asn Phe Arg Tyr Val Ile Ala Thr Tyr Asp Ile Ser 515 520 525 Arg Gly Asp His Ala Ile Val Tyr Tyr Val Tyr Asp Pro Ile Arg Thr 530 535 540 Ile Ser Tyr Thr His Pro Phe Arg Leu Thr Thr Lys Gly Arg Pro Asp 545 550 555 560 Phe Leu Arg Ile Glu Cys Phe Val Trp Asp Asp Asp Leu Trp Cys His 565 570 575 Gln Phe Tyr Arg Phe Glu Thr Asp Ser Thr Asn Ser Thr Thr Ser Val 580 585 590 Glu Asn Leu Val Arg Ile Arg Phe Ser Cys Ser Arg Ser Lys Pro 595 600 605 <210> 597 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 597 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108 <210> 598 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 598 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcugcu cgacgcgucc ucgagcagaa gcaucaaag 99 <210> 599 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 599 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcugcu cgcuccguuc gagcagaagc aucaaag 97 <210> 600 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 600 guacuggcgc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcccu cuucggaggg aagcaucaaa g 91 <210> 601 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 601 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcagga guuucuaugg aaacccugaa gcaucaaag 99 <210> 602 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 602 guacuggcgc cuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99 <210> 603 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 603 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcugcg cuugcgcaga agcaucaaag 90 <210> 604 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 604 uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 605 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 605 uacuggcgcu uuuaucgcau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 606 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 606 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga cuucgguccg auaaauaaga agcaucaaag 110 <210> 607 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 607 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcacau gaggauuacc caugugaagc aucaaag 97 <210> 608 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 608 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuauu uaucgugaga aauccgauaa auaagaagca ucaaag 106 <210> 609 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 609 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcugca ugucuaagac agcagaagca ucaaag 96 <210> 610 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 610 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggg cuucggccga agcaucaaag 90 <210> 611 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 611 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaauc cauugcacuc cggauugaag caucaaag 98 <210> 612 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 612 uacuggcgcu uuucucgcau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 613 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 613 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggacu ucgguccgau aaauaagaag caucaaag 108 <210> 614 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 614 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcugcu cguuugcggc uacgagcaga agcaucaaag 100 <210> 615 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 615 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucgagag auaaauaaga agcaucaaag 100 <210> 616 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 616 uacggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 107 <210> 617 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 617 uacuggcgcc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99 <210> 618 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 618 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaucggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 619 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 619 uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggacu ucgguccgau aaauaagaag caucaaag 108 <210> 620 <211> 105 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 620 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucgagaa auccgauaaa uaagaagcau caaag 105 <210> 621 <211> 103 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 621 gcgcuuuuau cucauuacuu ugagagccau caccagcgac uaugucguau ggguaaagcg 60 cuuauuuauc ggagagaaau ccgauaaaua agaagcauca aag 103 <210> 622 <211> 103 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 622 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gagauaaaua agaagcauca aag 103 <210> 623 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 623 uacuggcgcu uuuaucucau uacuuuggag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua uuuaucggag aguauccgau aaauaagaag caucaaag 108 <210> 624 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 624 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu ucguaugggu 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 625 <211> 105 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 625 agcgcuuuua ucucauuacu uugagagcca ucaccagcga cuaugucgua uggguaaagc 60 gcuuauuuau cggagagaaa ugccgauaaa uaagaagcau caaag 105 <210> 626 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 626 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaaauaagaa gcaucaaag 109 <210> 627 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 627 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uguaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 628 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 628 gcgcuuuuau cucauuacuu ugagagccau caccagcgac uaugucguau ggguaaagcg 60 cuuauuuauc ggacuucggu ccgauaaaua agcgcaucaa ag 102 <210> 629 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 629 uacuggcgcu uuucucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 630 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 630 guggcgcuuu uaucucauua cuuugagagc caucaccagc gacuaugucg uauggguaaa 60 gcgcuuauuu aucggagaga aauccgauaa auaagaagca ucaaag 106 <210> 631 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 631 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgaccuuau gucguauggg 60 uaaagcgcuu auuuaucgga gagaaauccg auaaauaaga agcaucaaag 110 <210> 632 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 632 gauggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuauu uaucggacuu cgguccgaua aauaagaagc aucaaag 107 <210> 633 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 633 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaaagaagca ucaaag 106 <210> 634 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 634 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgaucuaug ucguaugggu 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 635 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 635 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aaggcuuauu uaucggagag aaauccgaua aaaagaagca ucaaag 106 <210> 636 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 636 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaaaagaagc aucaaag 107 <210> 637 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 637 uacuggcgcu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuauu uaucggacuu cgguccgaua aauaagaagc aucaaag 107 <210> 638 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 638 cggcgcuuuu cucgcauuac uuugagagcc aucaccagcg acuaugucgu auggguaaag 60 cgcuuauugu aucgagagau aaauaagaag caucaaag 98 <210> 639 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 639 cacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuucggagag aaauccgaua aauaagaagc aucaaag 107 <210> 640 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 640 uacuggcgcu uuaucucauu acuuugagag ccaucaccag cgacuucggu cguaugggua 60 aagcgcuuau guaucggcuu cggccgauac auaagaagca ucaaag 106 <210> 641 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 641 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60 aaagcgcuua uguaucggcu ucggccgaua cauaagaagc aucaaag 107 <210> 642 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 642 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggug 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 643 <211> 64 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 643 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60 aaag 64 <210> 644 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 644 gaugggcuuu uaucucauua cuuugagagc caucaccagc gacuucgguc guauggguaa 60 ag 62 <210> 645 <211> 105 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 645 gaugggcuuu uaucucauua cuuugagagc caucaccagc gacuucgguc guauggguaa 60 agcgcuuauu uaucggcuuc ggccgauaaa uaagaagcau caaag 105 <210> 646 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 646 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuaca cugggaucgc ugaauuagag aucggcgucc uuucauucua uauacuuugg 120 aguuuuaaaa ugucucuaag uacagaagca ucaaag 156 <210> 647 <211> 103 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 647 ggcgcuuuua ucucauuacu uugagagcca ucaccagcga cuucggucgu auggguaaag 60 cgcuuauuua ucggcuucgg ccgauaaaua agaagcauca aag 103 <210> 648 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 648 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuucggu cguaugggua 60 aagcgcuuau uuaucggcuu cggccgauaa auaagaagca ucaaag 106 <210> 649 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 649 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 650 <211> 112 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 650 uacuggcgcu uuuaucucau uacuuugaga gccaugcucc accagcgacu augucguaug 60 gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa ag 112 <210> 651 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 651 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgggguu aggguuaggg uuagggaagc aucaaag 97 <210> 652 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 652 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcggaggg agggagggag agggaaagca ucaaag 96 <210> 653 <211> 101 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 653 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcguuggg uuaggguuag gguuagggaa aagcaucaaa g 101 <210> 654 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 654 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggg cuucggccgg aagcaucaaa g 91 <210> 655 <211> 103 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 655 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgccugc ucaguacgag aggaaccgca ggaagcauca aag 103 <210> 656 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 656 uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcccuc uucggaggga agcaucaaag 90 <210> 657 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 657 uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 658 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 658 uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcggac gaccucucgg ucguccgaag caucaaag 98 <210> 659 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 659 uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108 <210> 660 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 660 uacuggcgcc uuuaucugca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99 <210> 661 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 661 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 662 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 662 uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108 <210> 663 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 663 uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcggac gaccucucgg ucguccgaag caucaaag 98 <210> 664 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 664 uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcccuc uucggaggga agcaucaaag 90 <210> 665 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 665 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 666 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 666 uacuggcgcc uuuaucauca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99 <210> 667 <211> 194 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 667 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg ccggcauggu 120 cccagccucc ucgcuggcgc cggcugggca acauuccgag gggaccgucc ccucgguaau 180 ggcgaauggg accc 194 <210> 668 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 668 uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108 <210> 669 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 669 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga aauccgauaa auaagaagca ucaaag 106 <210> 670 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 670 uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcggac gaccucucgg ucguccgaag caucaaag 98 <210> 671 <211> 92 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 671 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgccgga cuucgguccg gaagcaucaa ag 92 <210> 672 <211> 108 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 672 uacuggcgcu uuuaucggau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108 <210> 673 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 673 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcggac gaccucucgg ucguccgaag caucaaag 98 <210> 674 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 674 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcccucu ucggagggaa gcaucaaag 89 <210> 675 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 675 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcucccucu ucggagggag caucaaag 88 <210> 676 <211> 197 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 676 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg gucggcaugg 120 caucuccacc uccucgcggu ccgaccuggg cauccgaagg aggacgcacg uccacucgga 180 uggcuaaggg agagcca 197 <210> 677 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 677 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcccucu ucggagggcg caucaaag 88 <210> 678 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 678 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaguu uuggccggca 120 uggucccagc cuccucgcug gcgccggcug ggcaacaugc uucggcaugg cgaaugggac 180 cccggg 186 <210> 679 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 679 gauggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 680 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 680 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcccucu ucggagggaa gcaucaaag 89 <210> 681 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 681 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcucuuacg gacuucgguc cguaagagca ucaaag 96 <210> 682 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 682 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcucggacg accucucggu cguccgagca ucaaag 96 <210> 683 <211> 160 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 683 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcc ugucaccgga 120 ugugcuuucc ggucugauga guccgugagg acgaaacagg 160 <210> 684 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 684 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcggacg accucucggu cguccgaagc aucaaag 97 <210> 685 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 685 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcggacg accucucggu cguccgaagc aucaaag 97 <210> 686 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 686 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcucaggug ggacgaccuc ucggucgucc uaucugagca ucaaag 106 <210> 687 <211> 177 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 687 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagga uggccggcau 120 ggucccagcc uccucgcugg cgccggcugg gcaacaccuu cggguggcga augggac 177 <210> 688 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 688 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107 <210> 689 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 689 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguacugggu 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 690 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 690 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucgugag aaauccgaua aauaagaagc aucaaag 107 <210> 691 <211> 109 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 691 guacuggcgc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109 <210> 692 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 692 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcggacg accucucggu cguccgaagc aucaaag 97 <210> 693 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 693 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 694 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 694 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 107 <210> 695 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 695 gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 696 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 696 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcccucu ucggagggaa gcaucaaag 89 <210> 697 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 697 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107 <210> 698 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 698 gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107 <210> 699 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 699 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107 <210> 700 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 700 uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 701 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 701 gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcccucu ucggagggaa gcaucaaag 89 <210> 702 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 702 gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 703 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 703 gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcggacg accucucggu cguccgaagc aucaaag 97 <210> 704 <211> 177 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 704 gauggccggc auggucccag ccuccucgcu ggcgccggcu gggcaacacc uucggguggc 60 gaaugggacu acuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc 120 guauggguaa agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 177 <210> 705 <211> 194 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 705 ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacauuccg aggggaccgu 60 ccccucggua auggcgaaug ggacccuacu ggcgcuuuua ucucauuacu uugagagcca 120 ucaccagcga cuaugucgua uggguaaagc gcuuauuuau cggagagaaa uccgauaaau 180 aagaagcauc aaag 194 <210> 706 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 706 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagcgca ucaaag 96 <210> 707 <211> 172 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 707 cgugguuagg gccacguuaa auaguugcuu aagcccuaag cguugaucuu cggaucaggu 60 gcaauacugg cgcuuuuauc ucauuacuuu gagagccauc accagcgacu augucguaug 120 gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa ag 172 <210> 708 <211> 197 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 708 gggucggcau ggcaucucca ccuccucgcg guccgaccug ggcauccgaa ggaggacgca 60 cguccacucg gauggcuaag ggagagccau acuggcgcuu uuaucucauu acuuugagag 120 ccaucaccag cgacuauguc guauggguaa agcgcuuauu uaucggagag aaauccgaua 180 aauaagaagc aucaaag 197 <210> 709 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 709 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcc aguacugaug 120 aguccgugag gacgaaacga guaagcucgu cuacuggcgc uuuuaucuca u 171 <210> 710 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 710 uacuggcgcc uuuaucucau uacuuuagag agccaucacc agcgacuaug ucguaugggu 60 aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99 <210> 711 <211> 157 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 711 cgacuacuga ugaguccgug aggacgaaac gaguaagcuc gucuagucgu acuggcgcuu 60 uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa agcgcuuauu 120 uaucggagag aaauccgaua aauaagaagc aucaaag 157 <210> 712 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 712 gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcaggug ggacgaccuc ucggucgucc uaucugcgca ucaaag 106 <210> 713 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 713 uacuggcgcc uuuaucucau uacuuuagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 714 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 714 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagca uuccucagaa 120 aaugacaaac cuguggggcg uaaguagauc uucggaucua ugaucgugca gacguuaaaa 180 ucaggu 186 <210> 715 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 715 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg acuacugaug 120 aguccgugag gacgaaacga guaagcucgu cuagucgcgu guagcgaagc a 171 <210> 716 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 716 cauuccucag aaaaugacaa accugugggg cguaaguaga ucuucggauc uaugaucgug 60 cagacguuaa aaucagguua cuggcgcuuu uaucucauua cuuugagagc caucaccagc 120 gacuaugucg uauggguaaa gcgcuuauuu aucggagaga aauccgauaa auaagaagca 180 ucaaag 186 <210> 717 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 717 uuuuggccgg caugguccca gccuccucgc uggcgccggc ugggcaacau gcuucggcau 60 ggcgaauggg accccgggua cuggcgcuuu uaucucauua cuuugagagc caucaccagc 120 gacuaugucg uauggguaaa gcgcuuauuu aucggagaga aauccgauaa auaagaagca 180 ucaaag 186 <210> 718 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 718 cgacuacuga ugaguccgug aggacgaaac gaguaagcuc gucuagucgc guguagcgaa 60 gcauacuggc gcuuuuaucu cauuacuuug agagccauca ccagcgacua ugucguaugg 120 guaaagcgcu uauuuaucgg agagaaaucc gauaaauaag aagcaucaaa g 171 <210> 719 <211> 168 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 719 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg gagccccgcu 120 gaugaggucg gggagaccga aagggacuuc ggucccuacg gggcuccc 168 <210> 720 <211> 144 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 720 ccacccccac caccaccccc acccccacca ccacccuacu ggcgcuuuua ucucauuacu 60 uugagagcca ucaccagcga cuaugucgua uggguaaagc gcuuauuuau cggagagaaa 120 uccgauaaau aagaagcauc aaag 144 <210> 721 <211> 157 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 721 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg acuacugaug 120 aguccgugag gacgaaacga guaagcucgu cuagucg 157 <210> 722 <211> 172 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 722 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg ugguuagggc 120 cacguuaaau aguugcuuaa gcccuaagcg uugaucuucg gaucaggugc aa 172 <210> 723 <211> 184 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 723 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg caauaaagcg 120 guuacaagcc cgcaaaaaua gcagaguaau gucgcgauag cgcggcauua augcagcuuu 180 auug 184 <210> 724 <211> 122 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 724 uacuggcgcu uuuaucucau uacuauuauc ucauuacuuu gagagccauc accagcgacu 60 augucguaug gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa 120 ag 122 <210> 725 <211> 184 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 725 ggcaauaaag cgguuacaag cccgcaaaaa uagcagagua augucgcgau agcgcggcau 60 uaaugcagcu uuauuguacu ggcgcuuuua ucucauuacu uugagagcca ucaccagcga 120 cuaugucgua uggguaaagc gcuuauuuau cggagagaaa uccgauaaau aagaagcauc 180 aaag 184 <210> 726 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 726 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagac ccgcaaggcc 120 gacggcaucc gccgccgcug gugcaagucc agccgccccu ucgggggcgg gcgcucaugg 180 guaac 185 <210> 727 <211> 63 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 727 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aag 63 <210> 728 <211> 168 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 728 gggagccccg cugaugaggu cggggagacc gaaagggacu ucggucccua cggggcuccc 60 uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 120 aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 168 <210> 729 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 729 ccaguacuga ugaguccgug aggacgaaac gaguaagcuc gucuacuggc gcuuuuaucu 60 cauuacuggc gcuuuuaucu cauuacuuug agagccauca ccagcgacua ugucguaugg 120 guaaagcgcu uauuuaucgg agagaaaucc gauaaauaag aagcaucaaa g 171 <210> 730 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 730 acccgcaagg ccgacggcau ccgccgccgc uggugcaagu ccagccgccc cuucgggggc 60 gggcgcucau ggguaacuac uggcgcuuuu aucucauuac uuugagagcc aucaccagcg 120 acuaugucgu auggguaaag cgcuuauuua ucggagagaa auccgauaaa uaagaagcau 180 caaag 185 <210> 731 <211> 160 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 731 ccugucaccg gaugugcuuu ccggucugau gaguccguga ggacgaaaca gguacuggcg 60 cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg uaaagcgcuu 120 auuuaucgga gagaaauccg auaaauaaga agcaucaaag 160 <210> 732 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 732 guacuggcgc cuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaguggg 60 uaaagcgcuu acggacuucg guccguaaga agcaucaaag 100 <210> 733 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 733 guacuggcgc uuuuaucuga uuacuuugag agccaucacc agcgacuaug ucguaguggg 60 uaaagcuccc ucuucggagg gagcaucaaa g 91 <210> 734 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 734 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 735 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 735 acuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 736 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 736 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 737 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 737 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcucccucu ucggagggag caucaaag 88 <210> 738 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 738 acuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 739 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 739 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 740 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 740 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 741 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 741 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 742 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 742 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 743 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 743 acuggcgccu uuaucaucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60 aagcgcuuac ggacuucggu ccguaagaag caucaaag 98 <210> 744 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 744 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcgcccuc uucggaggga agcaucaaag 90 <210> 745 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 745 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucacau gaggaucacc caugugagca ucaaag 96 <210> 746 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 746 acuggcacuu uuaccugauu acuuugagag ccaacaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 747 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 747 acuggcacuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 748 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 748 acuggcccuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 749 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 749 acuggcgcuu uuaccugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 750 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 750 acuggcgcuu uuaucugauu acuuugagag ccaacaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 751 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 751 acuggcaccu uuaccugauu acuuugagag ccaacaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 752 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 752 acuggcaccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 753 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 753 acuggccccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 754 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 754 acuggcgccu uuaucugauu acuuugagag ccaacaccag cgacuauguc guauggguaa 60 agcgcuuacg gacuucgguc cguaagaagc aucaaag 97 <210> 755 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 755 gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 756 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 756 gacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60 aaagcucccu cuucggaggg agcaucaaag 90 <210> 757 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 757 acuggcgccu uuaucugauu acuuuggaga gccaucacca gcgacuaugu cguagugggu 60 aaagcucccu cuucggaggg agcaucaaag 90 <210> 758 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 758 acuggcgcau uuaucugauu acuuugugag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 759 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 759 acuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 760 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 760 acuggcgcuu uuaucugauu acuuuggaga gccaucacca gcgacuaugu cguagugggu 60 aaagcucccu cuucggaggg agcaucaaag 90 <210> 761 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 761 acuggcgcau uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 762 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 762 acuggcgcuu uuaucugauu acuuugugag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 763 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 763 acuggcgcuu uuauucugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60 aaagcucccu cuucggaggg agcaucaaag 90 <210> 764 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 764 acggcgcuuu uaucugauua cuuugagagc caucaccagc gacuaugucg uaguggguaa 60 agcucccucu ucggagggag caucaaag 88 <210> 765 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 765 acuggcgcuu uuauaugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 766 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 766 acuggcgcuu uuaucuugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60 aaagcucccu cuucggaggg agcaucaaag 90 <210> 767 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 767 acuggcgcuu uuaucugauu acuuugagag ccagcaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 768 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 768 acuggcgcug uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucgaag 89 <210> 769 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 769 acuggcgcuc uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucgaag 89 <210> 770 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 770 acuggcgcuu guaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucagag 89 <210> 771 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 771 acuggcgcuu cuaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucagag 89 <210> 772 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 772 acuggcgcuu ugaucugauu accuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaagg 89 <210> 773 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 773 acuggcgcuu ucaucugauu accuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaagg 89 <210> 774 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 774 acuggcgcug uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 775 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 775 acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucgaag 89 <210> 776 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 776 acuggcgcuu uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucaaag 89 <210> 777 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 777 acuggcacuu cuaucugauu acucugagag ccaucaccag cgacuauguc guauggguaa 60 agccgcuuac ggacuucggu ccguaagagg caucagag 98 <210> 778 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 778 acuggcacuu cuaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucagag 89 <210> 779 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 779 acuggcaccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60 agccgcuuac ggacuucggu ccguaagagg caucaaag 98 <210> 780 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 780 acuggcacuu guaucugauu acucugagag ccaucaccag cgacuauguc guauggguaa 60 agccgcuuac ggacuucggu ccguaagagg caucagag 98 <210> 781 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> gNA Variant Scaffold Sequence <400> 781 acuggcacuu guaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60 aagcucccuc uucggaggga gcaucagag 89 <210> 782 <211> 747 <212> DNA <213> Alpharetrovirus Rous sarcoma virus <400> 782 cctgtggtta tcaagacaga gggccctgct tggacccctc tggaaccaaa gctgattaca 60 agactcgccg acaccgtgcg gaccaagggc ctgcggagcc ctatcaccat ggccgagatg 120 gaagctctga tgagcagccc actgctgccc cacgacgtga ccaacctgat gagagtgatc 180 ctgggccccg ccccttacgc cctgtggatg gacgcctggg gggtgcagct gcagaccgtg 240 attgccgccg ccaccagaga tcctagacac cctgctaacg gccaaggcag aggcgaaaga 300 accaaccttg acagactgaa aggcctggcc gatggaatgg tcggcaacag cgaaggccag 360 gccgccctgc tgagacctgg cgagctggtg gctatcacag ccagcgccct gcaggccttc 420 agagaagtgg cccgactggc tgagcccacg gacccttggg ccgacatcat gcagggccct 480 tctgagagct tcgtggactt cgccaataga ctgatcaagg ccgtcgaggg cagcgatctt 540 cctcctagcg cgagagcccc tgttatcatc gactgcttcc ggcagaaaag ccagcccgac 600 atccaacagc tgatcagagc cgccccttcc accctgacca caccaggcga gatcatcaag 660 tacgtgctgg atagacagaa gaccgcccct ctgaccgatc agggcatcgc cgctgccatg 720 tcctctgcca tccagcctct ggtgatg 747 <210> 783 <211> 4787 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence <400> 783 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc caaagaagaa gcggaaggtc tctagacaag 1800 agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 1860 ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 1920 agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 1980 gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 2040 acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 2100 ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 2160 tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 2220 aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 2280 agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 2340 catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 2400 gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 2460 gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 2520 agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 2580 ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 2640 cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 2700 tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 2760 tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 2820 attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 2880 aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 2940 gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 3000 tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 3060 agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 3120 ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 3180 ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 3240 tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 3300 tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 3360 gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 3420 tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 3480 agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 3540 tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 3600 gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 3660 acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 3720 aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 3780 atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 3840 actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 3900 ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 3960 acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 4020 tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 4080 gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 4140 tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 4200 agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 4260 gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 4320 agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 4380 aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 4440 gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 4500 gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 4560 aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 4620 accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 4680 gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 4740 agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4787 <210> 784 <211> 4787 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence <400> 784 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc caaagaagaa gcggaaggtc tctagacaag 1800 agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 1860 ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 1920 agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 1980 gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 2040 acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 2100 ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 2160 tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 2220 aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 2280 agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 2340 catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 2400 gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 2460 gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 2520 agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 2580 ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 2640 cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 2700 tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 2760 tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 2820 attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 2880 aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 2940 gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 3000 tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 3060 agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 3120 ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 3180 ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 3240 tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 3300 tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 3360 gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 3420 tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 3480 agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 3540 tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 3600 gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 3660 acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 3720 aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 3780 atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 3840 actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 3900 ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 3960 acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 4020 tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 4080 gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 4140 tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 4200 agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 4260 gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 4320 agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 4380 aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 4440 gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 4500 gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 4560 aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 4620 accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 4680 gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 4740 agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4787 <210> 785 <211> 4869 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X-PR plasmid sequence <400> 785 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620 gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680 aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740 agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800 gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860 ttaaatttt 4869 <210> 786 <211> 4869 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X-PR plasmid sequence <400> 786 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620 gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680 aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740 agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800 gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860 ttaaatttt 4869 <210> 787 <211> 4563 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 787 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tga 4563 <210> 788 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 788 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 789 <211> 4563 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 789 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tga 4563 <210> 790 <211> 4563 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 790 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tga 4563 <210> 791 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 791 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 792 <211> 4869 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X (no p1/p6)plasmid sequence <400> 792 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620 gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680 aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740 agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800 gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860 ttaaatttt 4869 <210> 793 <211> 4338 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1-X plasmid sequence <400> 793 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgct 4338 <210> 794 <211> 4395 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X-(-1)-PR plasmid sequence <400> 794 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380 gtccctgact acgct 4395 <210> 795 <211> 4814 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-(-1)-PR plasmid sequence <400> 795 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380 ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440 ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500 ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560 taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620 aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680 aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740 tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800 gcactttaaa tttt 4814 <210> 796 <211> 4649 <212> DNA <213> Artificial Sequence <220> <223> MA-X-NC-(-1)-PR plasmid sequence <400> 796 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200 tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260 ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320 ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380 tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440 atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500 ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560 aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620 tgactcagat tggctgcact ttaaatttt 4649 <210> 797 <211> 4151 <212> DNA <213> Artificial Sequence <220> <223> MA-X-(-1)-PR plasmid sequence <400> 797 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480 gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540 aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600 aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660 aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720 aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780 aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840 tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900 gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960 tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020 taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080 tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140 ctttaaattt t 4151 <210> 798 <211> 3926 <212> DNA <213> Artificial Sequence <220> <223> MA-X-PR plasmid sequence <400> 798 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480 ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540 ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600 atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660 tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720 cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780 gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840 ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900 ctcagattgg ctgcacttta aatttt 3926 <210> 799 <211> 3759 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-PR plasmid sequence <400> 799 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480 cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540 ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600 atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660 tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720 agaaatctgt tgactcagat tggctgcact ttaaatttt 3759 <210> 800 <211> 4482 <212> DNA <213> Artificial Sequence <220> <223> MA-X plasmid sequence <400> 800 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200 tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260 acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320 atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380 atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440 ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482 <210> 801 <211> 3450 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X plasmid sequence <400> 801 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct 3450 <210> 802 <211> 4173 <212> DNA <213> Artificial Sequence <220> <223> MA-X-X-(-1)-PR plasmid sequence <400> 802 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gct 4173 <210> 803 <211> 7709 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-X-(-1)-PR plasmid sequence <400> 803 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gctaacttta gccagaacta tccgattgtg 4200 cagaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 4260 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 4320 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 4380 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 4440 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 4500 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 4560 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 4620 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 4680 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 4740 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 4800 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 4860 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 4920 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 4980 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 5040 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 5100 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 5160 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 5220 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 5280 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 5340 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 5400 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 5460 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 5520 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 5580 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 5640 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 5700 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 5760 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 5820 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 5880 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 5940 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 6000 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 6060 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 6120 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 6180 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 6240 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 6300 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 6360 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 6420 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 6480 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 6540 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 6600 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 6660 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 6720 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 6780 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 6840 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 6900 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 6960 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 7020 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 7080 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 7140 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 7200 ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 7260 tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 7320 ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 7380 ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 7440 tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 7500 atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 7560 ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 7620 aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 7680 tgactcagat tggctgcact ttaaatttt 7709 <210> 804 <211> 7874 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X-X-(-1)-PR plasmid sequence <400> 804 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgctaa ctttagccag aactatccga ttgtgcagac cggtgcccca 4380 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 4440 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 4500 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 4560 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 4620 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 4680 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 4740 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 4800 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 4860 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 4920 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 4980 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 5040 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 5100 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 5160 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 5220 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 5280 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 5340 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 5400 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 5460 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 5520 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 5580 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 5640 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 5700 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 5760 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 5820 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 5880 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 5940 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 6000 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 6060 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 6120 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 6180 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 6240 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 6300 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 6360 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 6420 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 6480 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 6540 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 6600 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 6660 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 6720 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 6780 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 6840 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 6900 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 6960 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 7020 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 7080 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 7140 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 7200 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 7260 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 7320 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 7380 gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 7440 ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 7500 ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 7560 ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 7620 taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 7680 aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 7740 aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 7800 tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 7860 gcactttaaa tttt 7874 <210> 805 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> Gag-1%TCS-STx-HA plasmid sequence <400> 805 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttgaga atgtttactt ccagagcggc accggtaccg gtgccccaaa gaagaagcgg 1560 aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1620 agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1680 acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1740 cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1800 aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1860 agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1920 gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1980 ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2040 agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2100 gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2160 tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2220 ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2280 atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2340 ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2400 cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2460 gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2520 agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2580 agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2640 gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2700 gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2760 taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2820 gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2880 aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2940 ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3000 tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3060 attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3120 ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3180 aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3240 tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3300 gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3360 atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3420 atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3480 ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3540 ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3600 ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3660 agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3720 ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3780 aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3840 aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3900 accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3960 ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4020 accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4080 accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4140 aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4200 gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4260 aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4320 gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4380 agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4440 tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4500 gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4560 tacgct 4566 <210> 806 <211> 2064 <212> DNA <213> Artificial Sequence <220> <223> Gag-PCS-HRV3c plasmid sequence <400> 806 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560 aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620 gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680 atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740 gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800 ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860 gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920 atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980 ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040 aaaaaacagt acttcgttga aaag 2064 <210> 807 <211> 4557 <212> DNA <213> Artificial Sequence <220> <223> Gag-TCS-STx-HA plasmid sequence <400> 807 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttgaga atctttattt tcagggcacc ggtgccccaa agaagaagcg gaaggtctct 1560 agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1620 aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1680 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1740 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1800 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1860 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1920 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1980 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2040 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2100 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2160 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2220 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2280 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2340 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2400 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2460 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2520 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557 <210> 808 <211> 2064 <212> DNA <213> Artificial Sequence <220> <223> Gag-PCS-HRV3c plasmid sequence <400> 808 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560 aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620 gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680 atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740 gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800 ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860 gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920 atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980 ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040 aaaaaacagt acttcgttga aaag 2064 <210> 809 <211> 4557 <212> DNA <213> Artificial Sequence <220> <223> Gag-PCS-STx-HA plasmid sequence <400> 809 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aacctggaag ttctgttcca ggggcccacc ggtgccccaa agaagaagcg gaaggtctct 1560 agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1620 aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1680 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1740 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1800 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1860 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1920 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1980 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2040 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2100 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2160 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2220 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2280 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2340 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata tcccagcgtg 2400 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2460 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2520 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557 <210> 810 <211> 2064 <212> DNA <213> Artificial Sequence <220> <223> Gag-PCS-HRV3c plasmid sequence <400> 810 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560 aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620 gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680 atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740 gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800 ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860 gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920 atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980 ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040 aaaaaacagt acttcgttga aaag 2064 <210> 811 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 (VSV-G)plasmid sequence <400> 811 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 812 <211> 1575 <212> DNA <213> Artificial Sequence <220> <223> pGP29 (Rabies) plasmid sequence <400> 812 atggttcctc aggctctcct gtttgtaccc cttctggttt ttccattgtg ttttgggaaa 60 ttccctattt acacgatacc agacaagctt ggtccctgga gtccgattga catacatcac 120 ctcagctgcc caaacaattt ggtagtggag gacgaaggat gcaccaacct gtcagggttc 180 tcctacatgg aacttaaagt tggatacatc ttagccataa aagtgaacgg gttcacttgc 240 acaggcgttg tgacggaggc tgaaacctac actaacttcg ttggttatgt cacaaccacg 300 ttcaaaagaa agcatttccg cccaacacca gatgcatgta gagccgcgta caactggaag 360 atggccggtg accccagata tgaagagtct ctacacaatc cgtaccctga ctaccgctgg 420 cttcgaactg taaaaaccac caaggagtct ctcgttatca tatctccaag tgtggcagat 480 ttggacccat atgacagatc ccttcactcg agggtcttcc ctagcgggaa gtgctcagga 540 gtagcggtgt cttctaccta ctgctccact aaccacgatt acaccatttg gatgcccgag 600 aatccgagac tagggatgtc ttgtgacatt tttaccaata gtagagggaa gagagcatcc 660 aaagggagtg agacttgcgg ctttgtagat gaaagaggcc tatataagtc tttaaaagga 720 gcatgcaaac tcaagttatg tggagttcta ggacttagac ttatggatgg aacatgggtc 780 tcgatgcaaa catcaaatga aaccaaatgg tgccctcccg ataagttggt gaacctgcac 840 gactttcgct cagacgaaat tgagcacctt gttgtagagg agttggtcag gaagagagag 900 gagtgtctgg atgcactaga gtccatcatg acaaccaagt cagtgagttt cagacgtctc 960 agtcatttaa gaaaacttgt ccctgggttt ggaaaagcat ataccatatt caacaagacc 1020 ttgatggaag ccgatgctca ctacaagtca gtcagaactt ggaatgagat cctcccttca 1080 aaagggtgtt taagagttgg ggggaggtgt catcctcatg tgaacggggt gtttttcaat 1140 ggtataatat taggacctga cggcaatgtc ttaatcccag agatgcaatc atccctcctc 1200 cagcaacata tggagttgtt ggaatcctcg gttatccccc ttgtgcaccc cctggcagac 1260 ccgtctaccg ttttcaagga cggtgacgag gctgaggatt ttgttgaagt tcaccttccc 1320 gatgtgcaca atcaggtctc aggagttgac ttgggtctcc cgaactgggg gaagtatgta 1380 ttactgagtg caggggccct gactgccttg atgttgataa ttttcctgat gacatgttgt 1440 agaagagtca atcgatcaga acctacgcaa cacaatctca gagggacagg gagggaggtg 1500 tcagtcactc cccaaagcgg gaagatcata tcttcatggg aatcacacaa gagtgggggt 1560 gagaccagac tgtaa 1575 <210> 813 <211> 1611 <212> DNA <213> Artificial Sequence <220> <223> pGP60 (FUG E)plasmid sequence <400> 813 atgttcatgc cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt 60 ctcatcattt tggcaaagaa ttcgccctta ggaaagatgg ttccgcaggt tcttttgttt 120 gtactccttc tgggtttttc gttgtgtttc gggaagttcc ccatttacac gataccagac 180 gaacttggtc cctggagccc tattgacata caccatctca gctgtccaaa taacctggtt 240 gtggaggatg aaggatgtac caacctgtcc gagttctcct acatggaact caaagtggga 300 tacatctcag ccatcaaagt gaacgggttc acttgcacag gtgttgtgac agaggcagag 360 acctacacca actttgttgg ttatgtcaca accacattca agagaaagca tttccgcccc 420 accccagacg catgtagagc cgcgtataac tggaagatgg ccggtgaccc cagatatgaa 480 gagtccctac acaatccata ccccgactac cactggcttc gaactgtaag aaccaccaaa 540 gagtccctca ttatcatatc cccaagtgtg acagatttgg acccatatga caaatccctt 600 cactcaaggg tcttccctgg cggaaagtgc tcaggaataa cggtgtcctc tacctactgc 660 tcaactaacc atgattacac catttggatg cccgagaatc cgagaccaag gacaccttgt 720 gacattttta ccaatagcag agggaagaga gcatccaacg ggaacaagac ttgcggcttt 780 gtggatgaaa gaggcctgta taagtctcta aaaggagcat gcaggctcaa gttatgtgga 840 gttcttggac ttagacttat ggatggaaca tgggtcgcga tgcaaacatc agatgagacc 900 aaatggtgcc ctccagatca gttggtgaat ttgcacgact ttcgctcaga cgagatcgag 960 catctcgttg tggaggagtt agttaagaaa agagaggaat gtctggatgc attagagtcc 1020 atcatgacca ccaagtcagt aagtttcaga cgtctcagtc acctgagaaa acttgtccca 1080 gggtttggaa aagcatatac catattcaac aaaaccttga tggaggctga tgctcactac 1140 aagtcagtcc ggacctggaa tgagatcatc ccctcaaaag ggtgtttgaa agttggagga 1200 aggtgccatc ctcatgtgaa cggggtgttt ttcaatggta taatattagg gcctgacgac 1260 catgtcctaa tcccagagat gcaatcatcc ctcctccagc aacatatgga gttgttggaa 1320 tcttcagtta tccccctgat gcaccccctg gcagaccctt ctacagtttt caaagaaggt 1380 gatgaggctg aggattttgt tgaagttcac ctcgagaaaa atccaatcga gcttgtagaa 1440 ggttggttca gtagttggaa aagctctatt gcctcttttt tctttatcat agggttaatc 1500 attggactat tcttggttct ccgagttggt atccatcttt gcattaaatt aaagcacacc 1560 aagaaaagac agatttatac agacatagag atgaaccgac ttggaaagta a 1611 <210> 814 <211> 2721 <212> DNA <213> Artificial Sequence <220> <223> pGP14.1 (HSV-1 gB) plasmid sequence <400> 814 gccaccatga ggcaaggtgc acctgccagg ggtcggagat ggtttgttgt atgggctctg 60 ctgggactga ctttgggcgt gctcgttgct tccgcagcac cctcttctcc aggaacacct 120 ggcgtggctg cagccacgca agctgctaat ggcgggccag ctaccccagc cccaccggca 180 ccaggagctc cacctactgg cgatcccaag ccaaagaaga ataagaagcc aaagccacct 240 aaaccccctc gaccagctgg tgataatgct acagtggctg caggtcatgc tacactcaga 300 gaacatctta gagatataaa agctgaaaat acagacgcta atttctatgt ctgtccccca 360 cctacaggtg caaccgttgt ccaatttgaa caacccagga gatgtcctac acgtccagaa 420 gggcagaatt ataccgaagg tatagccgtt gtgtttaaag aaaatattgc accatataaa 480 tttaaagcga cgatgtatta taaggatgtg acagtcagcc aagtatggtt tgggcatcga 540 tatagccaat tcatgggcat tttcgaagat agagcacctg taccgtttga agaagttata 600 gataaaataa atgcaaaagg cgtgtgccgt agcacagcga aatatgttcg gaataatttg 660 gaaacaacgg cattccatcg cgatgatcat gaaacagata tggaacttaa gcccgcaaat 720 gctgccacac gtacctctcg tgggtggcat actacagatc tgaaatataa tccatcacga 780 gtcgaagcat ttcatcgata tggaacaacc gtgaattgta ttgtggaaga agttgatgcc 840 agaagtgttt atccttatga tgaattcgtc ctcgcaacag gagatttcgt ttatatgtca 900 ccattctatg gatatcgtga aggtagtcat acagagcata cttcttatgc agcagatagg 960 tttaaacaag tggatggttt ctatgctcgg gatttgacta caaaagcaag agctacagcc 1020 cccacaactc gaaatcttct gaccactcct aaatttactg tagcgtggga ttgggtaccc 1080 aaacgaccat ccgtatgtac tatgacaaaa tggcaagaag tagatgaaat gcttcggtct 1140 gaatatggtg gaagctttag attttcaagt gatgcaatct ctactacatt tacaactaat 1200 ctcacagaat atcccctttc acgagtcgat ttgggagatt gtattggtaa agatgcgcgg 1260 gatgcaatgg atcggatatt tgctcgtaga tataatgcca cacatataaa agttggacaa 1320 ccacaatatt atctcgcaaa cggcgggttc ctcattgcct atcaaccgct cctttctaat 1380 actcttgccg aactctatgt ccgagagcat ctgagggaac aatcacgtaa accgccgaat 1440 ccaacacctc ctccgcctgg agcatccgcg aatgcctctg tcgaacgtat aaagacaacg 1500 tcttcaattg aatttgctag acttcaattc acctataatc atatccaaag gcacgttaat 1560 gacatgctgg gtagagtcgc aattgcttgg tgtgaattgc aaaaccatga acttacgttg 1620 tggaatgaag cacgtaaatt gaatccaaat gcaattgcta gcgcgacggt tggacgcaga 1680 gtttccgccc gaatgctggg agatgttatg gcagtttcta catgtgtccc cgtggctgcc 1740 gataatgtca tagtgcagaa ttcaatgaga atatctagcc gacctggtgc atgttattct 1800 agaccactcg tgagtttccg ctatgaggat caagggcccc tggttgaagg ccaactcgga 1860 gaaaataatg aattgcgctt gacaagggac gcaattgaac catgtacagt tggccatcgc 1920 cggtatttta catttggcgg cgggtatgtc tactttgagg aatatgccta tagtcatcaa 1980 ctttctcgtg ctgatattac aactgtgtca acatttattg atctgaatat tacgatgctt 2040 gaagaccacg aattcgtacc gttggaagtc tatacacgcc atgagataaa agattccggg 2100 cttttggatt ataccgaagt gcaacgacgg aatcaactcc atgatctccg attcgcggat 2160 attgataccg taattcatgc tgatgcaaat gctgctatgt ttgctggact tggggcattc 2220 tttgaaggaa tgggcgatct cggaagagca gttgggaaag tcgttatggg aatagttggt 2280 ggtgtcgtta gtgcggtttc aggtgtcagc agctttatga gcaatccatt cggcgccctc 2340 gcagttgggc tcctggtgct tgctgggctt gctgctgctt tctttgcttt ccggtatgtg 2400 atgaggcttc aatccaatcc aatgaaagca ctttatccct tgactactaa agaactgaag 2460 aatccgacta atcctgatgc ttcaggagaa ggggaagaag gcggggattt cgatgaagct 2520 aaactggcgg aagcacgtga aatgatccgt tatatggcat tggtcagcgc tatggaaaga 2580 accgagcata aagctaagaa gaaaggaact tctgcccttc tctctgctaa agttactgat 2640 atggtgatga gaaaacggcg taatacaaat tatactcagg taccgaataa ggatggcgat 2700 gcagatgaag atgatttgtt a 2721 <210> 815 <211> 1185 <212> DNA <213> Artificial Sequence <220> <223> pGP14.2 (HSV-1 gD) plasmid sequence <400> 815 atgggggggg ctgccgccag gttgggggcc gtgattttgt ttgtcgtcat agtgggcctc 60 catggggtcc gcagcaaata tgccttggtg gatgcctctc tcaagatggc cgaccccaat 120 cgctttcgcg gcaaagacct tccggtcctg gaccagctga ccgaccctcc gggggtccgg 180 cgcgtgtacc acatccaggc gggcctaccg gacccgttcc agccccccag cctcccgatc 240 acggtttact acgccgtgtt ggagcgcgcc tgccgcagcg tgctcctaaa cgcaccgtcg 300 gaggcccccc agattgtccg cggggcctcc gaagacgtcc ggaaacaacc ctacaacctg 360 accatcgctt ggtttcggat gggaggcaac tgtgctatcc ccatcacggt catggagtac 420 accgaatgct cctacaacaa gtctctgggg gcctgtccca tccgaacgca gccccgctgg 480 aactactatg acagcttcag cgccgtcagc gaggataacc tggggttcct gatgcacgcc 540 cccgcgtttg agaccgccgg cacgtacctg cggctcgtga agataaacga ctggacggag 600 attacacagt ttatcctgga gcaccgagcc aagggctcct gtaagtacgc cctcccgctg 660 cgcatccccc cgtcagcctg cctctccccc caggcctacc agcagggggt gacggtggac 720 agcatcggga tgctgccccg cttcatcccc gagaaccagc gcaccgtcgc cgtatacagc 780 ttgaagatcg ccgggtggca cgggcccaag gccccataca cgagcaccct gctgcccccg 840 gagctgtccg agacccccaa cgccacgcag ccagaactcg ccccggaaga ccccgaggat 900 tcggccctct tggaggaccc cgtggggacg gtggcgccgc aaatcccacc aaactggcac 960 ataccgtcga tccaggacgc cgcgacgcct taccatcccc cggccacccc gaacaacatg 1020 ggcctgatcg ccggcgcggt gggcggcagt ctcctggcag ccctggtcat ttgcggaatt 1080 gtgtactgga tgcgccgcca cactcaaaaa gccccaaagc gcatacgcct cccccacatc 1140 cgggaagacg accagccgtc ctcgcaccag cccttgtttt actta 1185 <210> 816 <211> 2517 <212> DNA <213> Artificial Sequence <220> <223> pGP14.3 (HSV-1 gH) plasmid sequence <400> 816 atgggaaacg gcttgtggtt tgttggtgtg ataatcctgg gagtagcctg gggccaagta 60 catgattgga cagaacaaac cgatccttgg ttcctggacg gacttgggat ggatcggatg 120 tattggcgag atacaaatac tggaagactc tggcttccta atacaccaga tcctcagaag 180 ccacccaggg gcttccttgc tccaccagat gagctcaatc ttacaacagc tagtctcccg 240 ctgctgagat ggtatgaaga acggttctgc ttcgtgctgg taacaaccgc tgaattccct 300 cgcgatccag gacaattgtt gtatattccc aaaacatatc ttctgggtcg accacccaat 360 gcctctctcc cagcacctac tacagtggaa ccaacagctc aacccccgcc gtccgtggct 420 cctctgaaag ggcttctgca taaccccgta gcatcagtct tgctccgcag tcgtgcgtgg 480 gtcacattca gcgctgtgcc cgatcctgaa gcactcactt ttcccagggg cgataatgtc 540 gccacagcat ctcatccttc tggaccacgc gacactccac cccctcgccc acctgtcggc 600 gctcgcaggc atcccacaac agaacttgat attactcatc ttcataatgc ctcaactaca 660 tggctggcta caagagggct tctgcggagc cccgggagat atgtctactt ttctccctct 720 gcttctacat ggccagttgg aatatggaca actggtgaac ttgtccttgg ttgtgacgca 780 gcacttgtca gggcccggta tggtcgcgag tttatgggac tggtcatctc aatgcatgat 840 tcaccgccag tcgaggtcat ggttgtgccg gccggtcaaa cactggaccg agtgggagat 900 cctgcagatg aaaatccacc tggcgccctg ccaggcccac ccggtggacc aaggtaccgc 960 gtgttcgtgc tcggttcact cacccgtgca gataatggta gcgccttgga tgcactgaga 1020 cgtgtcggtg ggtatcctga agaagggacc aattatgcac aatttctcag tagggcgtat 1080 gctgaattct ttagcggaga tgctggagct gaacaagggc cacggccacc cttgttttgg 1140 cggctcactg gactcctggc cacctctgga ttcgcatttg tcaatgctgc tcatgccaat 1200 ggggctgtat gtctgtctga tctcttgggg ttccttgctc atagtcgagc cctcgcaggc 1260 ctggctgctc ggggagctgc cggttgcgca gccgacagtg tcttcttcaa cgtttccgtg 1320 cttgacccga ctgcaagact tcaactggaa gcaagattgc aacatctcgt tgcagaaatc 1380 ttggaaaggg agcaatccct ggctctgcat gcactcggat accaactcgc atttgtactt 1440 gactcccctt ccgcctatga tgccgttgca ccttctgccg ctcacctgat tgatgcattg 1500 tacgcagaat tcctcggcgg aagggttctt actactccag tggtgcatag ggccttgttc 1560 tatgcttctg cggtattgag acaaccattt ctggccggag tgcctagcgc cgtccaaagg 1620 gagcgagcta ggagatcact cctgattgcc tctgcactct gcacatctga tgtagcagcc 1680 gccacaaatg ctgatctgag gactgccctc gctagagctg atcatcaaaa gacgcttttc 1740 tggctccccg atcatttcag tccttgtgca gcgtcactta gattcgacct tgatgaatca 1800 gtcttcatat tggatgcact cgcccaggca actagatctg aaacacctgt tgaggtgctc 1860 gctcaacaaa cacatggttt ggcttctaca ctcacaaggt gggcccatta taatgcattg 1920 attcgggctt ttgtgcccga agcgtcccac cgatgtggcg gacaatcagc aaatgtggaa 1980 cccaggatat tggtgcctat tacgcataat gcttcttatg tggttacgca tagcccattg 2040 ccacgcggca ttgggtataa actgacgggt gtggatgttc gcagacctct gtttctgact 2100 tatctgacag caacctgtga gggttctact cgcgacattg aaagcaaacg tctcgtaagg 2160 acgcagaatc aaagagattt gggtctggtt ggcgctgttt tcatgaggta tactcccgca 2220 ggcgaagtta tgagcgtcct gctcgtcgac accgataata cccaacaaca gattgcagcg 2280 ggccccacag aaggggctcc atcagtcttc tccagcgatg ttccttcaac cgcgctgctc 2340 ctgttcccga atggcacggt tatccacctg ttggcgttcg atacacaacc tgtcgcagcc 2400 atcgcaccgg gattcttggc tgcatccgcc ctcggggttg tgatgataac agcagctctc 2460 gcggggatac tgaaagtgct gcgcaccagc gtgcccttct tctggcgacg agagtta 2517 <210> 817 <211> 682 <212> DNA <213> Artificial Sequence <220> <223> pGP14.4 (HSV-1 gL) plasmid sequence <400> 817 atggggattt tgggttgggt cgggcttatt gccgttgggg ttttgtgtgt gcgggggggc 60 ttgccttcaa ccgaatatgt tattcggagt cgggtggctc gagaggtggg ggatatatta 120 aaggtgcctt gtgtgccgct cccgtctgac gatcttgatt ggcgttacga gaccccctcg 180 gctataaact atgctttgat agacggtata tttttgcgtt atcactgtcc cggattggac 240 acggtcttgt gggataggca tgcccagaag gcatattggg ttaacccctt tttatttgtg 300 gcgggttttt tggaggactt gagttacccc gcgtttcctg ccaacaccca ggaaacagaa 360 acgcgcttgg ccctttataa agagatacgc caggcgctgg acagtcgcaa gcaggccgcc 420 agccacacac ctgtgaaggc tgggtgtgtg aactttgact attcgcgcac ccgccgctgt 480 gtagggcgac aggatttggg acctaccaac ggaacgtctg gacggacccc ggttctgccg 540 ccggacgatg aagcgggcct gcagccgaag cccctcacca cgccgccgcc catcatcgcc 600 acgtcggacc ccaccccgcg acgggacgcc gccacaaaaa gcagacgccg acgaccccac 660 tcccggcgcc tcttataaga tc 682 <210> 818 <211> 1698 <212> DNA <213> Artificial Sequence <220> <223> pGP8 (RD114) plasmid sequence <400> 818 atgaaactcc caacaggaat ggtcatttta tgtagcctaa taatagttcg ggcagggttt 60 gacgaccccc gcaaggctat cgcattagta caaaaacaac atggtaaacc atgcgaatgc 120 agcggagggc aggtatccga ggccccaccg aactccatcc aacaggtaac ttgcccaggc 180 aagacggcct acttaatgac caaccaaaaa tggaaatgca gagtcactcc aaaaaatctc 240 acccctagcg ggggagaact ccagaactgc ccctgtaaca ctttccagga ctcgatgcac 300 agttcttgtt atactgaata ccggcaatgc agggcgaata ataagacata ctacacggcc 360 accttgctta aaatacggtc tgggagcctc aacgaggtac agatattaca aaaccccaat 420 cagctcctac agtccccttg taggggctct ataaatcagc ccgtttgctg gagtgccaca 480 gcccccatcc atatctccga tggtggagga cccctcgata ctaagagagt gtggacagtc 540 caaaaaaggc tagaacaaat tcataaggct atgcatcctg aacttcaata ccacccctta 600 gccctgccca aagtcagaga tgaccttagc cttgatgcac ggacttttga tatcctgaat 660 accactttta ggttactcca gatgtccaat tttagccttg cccaagattg ttggctctgt 720 ttaaaactag gtacccctac ccctcttgcg atacccactc cctctttaac ctactcccta 780 gcagactccc tagcgaatgc ctcctgtcag attatacctc ccctcttggt tcaaccgatg 840 cagttctcca actcgtcctg tttatcttcc cctttcatta acgatacgga acaaatagac 900 ttaggtgcag tcacctttac taactgcacc tctgtagcca atgtcagtag tcctttatgt 960 gccctaaacg ggtcagtctt cctctgtgga aataacatgg catacaccta tttaccccaa 1020 aactggacag gactttgcgt ccaagcctcc ctcctccccg acattgacat catcccgggg 1080 gatgagccag tccccattcc tgccattgat cattatatac atagacctaa acgagctgta 1140 cagttcatcc ctttactagc tggactggga atcaccgcag cattcaccac cggagctaca 1200 ggcctaggtg tctccgtcac ccagtataca aaattatccc atcagttaat atctgatgtc 1260 caagtcttat ccggtaccat acaagattta caagaccagg tagactcgtt agctgaagta 1320 gttctccaaa ataggagggg actggaccta ctaacggcag aacaaggagg aatttgttta 1380 gccttacaag aaaaatgctg tttttatgct aacaagtcag gaattgtgag aaacaaaata 1440 agaaccctac aagaagaatt acaaaaacgc agggaaagcc tggcatccaa ccctctctgg 1500 accgggctgc agggctttct tccgtacctc ctacctctcc tgggacccct actcaccctc 1560 ctactcatac taaccattgg gccatgcgtt ttcagtcgcc tcatggcctt cattaatgat 1620 agacttaatg ttgtacatgc catggtgctg gcccagcaat accaagcact caaagctgag 1680 gaagaagctc aggattta 1698 <210> 819 <211> 1743 <212> DNA <213> Artificial Sequence <220> <223> pGP23 (HCV) plasmid sequence <400> 819 atgggttgct ctttttctat cttcttactt gcccttctgt cgtgccttac agtgccagcg 60 tctgcggtgg aagttaggaa cgtcagttct agctactatg ccaccaatga ttgctcgaac 120 agcagcatca cctggcaact caacaacgca gttctccacc ttcctggatg cgtcccatgt 180 gagaatgata acggcacctt gcactgctgg atacaagtaa caccaaatgt ggctgtgaaa 240 caccgcggcg cgctcactca taacctgcgg acgcacgtcg atatgatcgt aatggcagct 300 acggtctgtt cggccctgta tgtgggagac atgtgcgggg ccgtgatgat tgtgtcgcag 360 gctctcataa tatcgccaga acgccacaac ttcacccaag agtgcaactg ttccatctac 420 caaggtcata tcactggcca tcgcatggca tgggacatga tgctaaactg gtcaccaact 480 cttaccatga tccttgctta tgccgctcgt gttcccgagc tagtccttga agttgtcttt 540 ggtggtcatt ggggtgtggt atttggcttg gcctatttct ccatgcaggg agcgtgggcc 600 aaggtcattg ccatcctcct tcttgttgcg ggagtggacg cagagactca taccaccggc 660 tcagctgcgg gtcatgccgc aagggggttt gccaacctcc ttagtcctgg ttccaagcaa 720 aaaataagtt tgatcaatac caatggcagc tggcacataa accggaccgc ccttaattgt 780 aatgacagct tgcagacggg tttcctcgct tctttgtttt acgtcaacaa cttcaacagc 840 tctggctgcc ccgagcgcat gtcttcctgc cgtgggctgg acgatttccg catcgggtgg 900 ggaaccctgg aatacgagac caacgtcacc aacgaggagg acatgaggcc gtactgctgg 960 cattaccctc cgaagccttg cggcattatc tcggctagga cagtttgcgg gccggtctac 1020 tgtttcactc ctagccctgt tgttgtgggt actactgacg agcagggctt gcccacctat 1080 agctgggggg aaaatgagac cgatgtcttc ctgttaaata gcacaagacc cccgcaagga 1140 gcttggttcg gctgcacttg gatgaatggg actgggttta ctaagacatg cggtgcacca 1200 ccttgccgca ttaggaggga tttcaacagc accctcgatc tactgtgccc cacagactgc 1260 tttagaaagc acccggacac cacctatctc aagtgtggag cagggccttg gttaaccccc 1320 agatgcctgg tagactaccc ttatagattg tggcattatc cgtgcaccgt aaattttacc 1380 atctttaagg tgcggatgta tgtggggggg gtggagcatc gattgtcagc agcatgcaac 1440 ttcacgcgcg gggaccgctg cagattggag gacagagata ggggtcagca gagcccactg 1500 ctgcattcca ccactgagtg ggcggtatta ccatgctctt tctccgactt accggcactg 1560 tccactggtc tattgcacct ccatcaaaat atcgtggacg tgcagtatct ctatggactt 1620 actccggcta tcacaaaata catcgtgaag tgggagtggg tggttctcct ctttttgctg 1680 ttggcagacg ccagggtctg tgcgtgcctt tggatgctca tcatattggg ccaagccgaa 1740 gcg 1743 <210> 820 <211> 2028 <212> DNA <213> Artificial Sequence <220> <223> pGP41 (EBOV) plasmid sequence <400> 820 atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60 ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120 agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180 aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240 tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300 gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360 tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420 gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480 ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540 gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600 gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660 caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720 tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780 tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840 attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900 attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960 cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020 atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080 gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140 aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200 gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260 ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320 actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380 aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440 ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500 agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560 caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620 ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680 ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740 accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800 tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860 gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920 aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980 gttataattg cagttatcgc tttattctgt atatgcaaat ttgtcttt 2028 <210> 821 <211> 1569 <212> DNA <213> Artificial Sequence <220> <223> pGP30 (Mokola) plasmid sequence <400> 821 atgaatatac cttgctttgt tgtgattctc agcttagcca ctacacattc tctgggagaa 60 ttccccttgt acacaattcc tgagaagata gagaaatgga ctcccataga catgatccat 120 ctgagttgcc ccaacaacct attatctgag gaagaaggtt gcaatgcaga gtcatccttt 180 acttactttg agctcaagag tggttaccta gctcatcaga aggttccagg gtttacctgt 240 accggggtcg tgaacgaggc agagacatat acaaacttcg tcgggtacgt caccacaacc 300 ttcaaaagga agcactttag gcctacagta gccgcctgtc gtgatgccta caactggaaa 360 gtgtcaggag accccaggta cgaagagtca ctccacactc cttatcctga cagcagttgg 420 ttgaggactg tgactacaac caaagaatca cttctcataa tatcgcccag catcgtggaa 480 atggatattt acggcaggac tctccattcc cccatgtttc cttcaggagt atgttccaac 540 gtatatccct ctgtcccatc ctgtgagact aatcatgatt acacattatg gctgcctgaa 600 gatcctagtt tgagtttggt ctgtgatatc tttacttcca gcaacggaaa gaaggccatg 660 aacgggtcac gcatctgcgg attcaaggat gaaaggggat tctacagatc tttaaagggc 720 gcttgcaagc tgacattgtg tggaagacct ggaattaggt tattcgacgg aacttgggtc 780 tcttttacaa agccggacgt gcacgtatgg tgcactccca accaattgat caatatacac 840 aatgacagac tagatgagat agaacacctg atcgtggaag acatcataaa gaaaagagaa 900 gagtgcttag acaccctgga aacaatactt atgtctcaat ctgttagctt tagaaggttg 960 agccatttcc gaaagttagt tccaggatat gggaaggcct acactatttt aaacggcagc 1020 ctgatggaaa caaatgtcta ctacaaaagg gtcgacaagt gggctgacat cttaccctct 1080 aagggatgtc tgaaagtcgg gcaacaatgc atggaacctg tcaaaggagt cctcttcaat 1140 gggattatca agggcccgga tggccaaatt ttgatccccg agatgcagtc agagcagcta 1200 aagcagcata tggacctgtt gaaggcggct gtgtttcctc tccgacaccc tttaatcagc 1260 cgggaggcag tctttaagaa agacggggat gccgatgatt ttgtggatct ccatatgcct 1320 gatgtccaca agtctgtgtc agatgtcgac ctgggtctgc ctcattgggg tttctggatg 1380 ttgatcgggg caacaatagt agcatttgtg gtcttggtat gtttactccg tgtatgttgt 1440 aagagagtga ggaggagaag atcaggacgt gcaactcagg agatccccct gagctttccc 1500 tctgcccctg ttcctcgagc caaagtggtg tcatcttggg agtcctataa agggcttcca 1560 ggtacatta 1569 <210> 822 <211> 9586 <212> DNA <213> Artificial Sequence <220> <223> pMRG103 (Gag-CasX119-PR) plasmid sequence <400> 822 gtcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt cactctcccc 420 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480 gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg 540 gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt 600 tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660 gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc gccgcccgcc 720 ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc 780 gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc tgcgtgaaag 840 ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct gtgagcgctg 960 cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc ggccgggggc 1020 ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg ggtgtgtgcg 1080 tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc cctgcacccc 1140 cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc ggggcgtggc 1200 gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 1260 ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gccccggagc gccggcggct 1320 gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 1380 gacttccttt gtcccaaatc tggcggagcc gaaatctggg aggcgccgcc gcaccccctc 1440 tagcgggcgc gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt 1500 cgtgcgtcgc cgcgccgccg tccccttctc catctccagc ctcggggctg ccgcaggggg 1560 acggctgcct tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg 1620 gctctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1680 acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attcgccacc atgggtgcga 1740 gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg ttaaggccag 1800 ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag ctagaacgat 1860 tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata ctgggacagc 1920 tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acagtagcaa 1980 ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct ttagacaaga 2040 tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct gacacaggac 2100 acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg caaatggtac 2160 atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa gagaaggctt 2220 tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc ccacaagatt 2280 taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg ttaaaagaga 2340 ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca gggcctattg 2400 caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact agtacccttc 2460 aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa atctataaaa 2520 gatggataat cctgggatta aataaaatag taagaatgta tagccctacc agcattctgg 2580 acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc tataaaactc 2640 taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc ttgttggtcc 2700 aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga gcgacactag 2760 aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca agagttttgg 2820 ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa ggcaatttta 2880 ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac atagccaaaa 2940 attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga caccaaatga 3000 aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc cacaagggaa 3060 ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa gagagcttca 3120 ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac aaggaactgt 3180 atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa aactttagcc 3240 agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc tctagacaag 3300 agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 3360 ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 3420 agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 3480 gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 3540 acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 3600 ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 3660 tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 3720 aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 3780 agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 3840 catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 3900 gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 3960 gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 4020 agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 4080 ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 4140 cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 4200 tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 4260 tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 4320 attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 4380 aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 4440 gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 4500 tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 4560 agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 4620 ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 4680 ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 4740 tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 4800 tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 4860 gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 4920 tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 4980 agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 5040 tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 5100 gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 5160 acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 5220 aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 5280 atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 5340 actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 5400 ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 5460 acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 5520 tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 5580 gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 5640 tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 5700 agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 5760 gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 5820 agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 5880 aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 5940 gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 6000 gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 6060 aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 6120 accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 6180 gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 6240 agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttcc tttagcttcc 6300 ctcagatcac tctttggcag cgacccctcg tcacaataaa gatagggggg caattaaagg 6360 aagctctatt agatacagga gcagatgata cagtattaga agaaatgaat ttgccaggaa 6420 gatggaaacc aaaaatgata gggggaattg gaggttttat caaagtaaga cagtatgatc 6480 agatactcat agaaatctgc ggacataaag ctataggtac agtattagta ggacctacac 6540 ctgtcaacat aattggaaga aatctgttga ctcagattgg ctgcacttta aatttttgac 6600 tagcagatct ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc 6660 tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt 6720 gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag aatgagtatt 6780 tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa ggttggctat 6840 aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc catagaaaag 6900 ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt tctttaacat 6960 ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc tgactactcc 7020 cagtcatagc tgtccctctt ctcttatgaa gatccctcga cctgcagccc aagcttggcg 7080 taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 7140 atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 7200 ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagcggatc 7260 cgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 7320 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 7380 aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 7440 gcctaggctt ttgcaaaaag ctaacttgtt tattgcagct tataatggtt acaaataaag 7500 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 7560 gtccaaactc atcaatgtat cttatcatgt ctggatccgc tgcattaatg aatcggccaa 7620 cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 7680 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 7740 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 7800 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 7860 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 7920 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 7980 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 8040 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8100 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 8160 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 8220 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 8280 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 8340 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 8400 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 8460 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 8520 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 8580 acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 8640 tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 8700 ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 8760 ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 8820 tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 8880 aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 8940 ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 9000 ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 9060 gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 9120 gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 9180 cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 9240 actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 9300 ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 9360 tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 9420 ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 9480 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 9540 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctg 9586 <210> 823 <211> 9586 <212> DNA <213> Artificial Sequence <220> <223> pMRG103 (Gag-CasX438-PR) plasmid sequence <400> 823 gtcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt cactctcccc 420 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480 gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg 540 gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt 600 tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660 gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc gccgcccgcc 720 ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc 780 gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc tgcgtgaaag 840 ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct gtgagcgctg 960 cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc ggccgggggc 1020 ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg ggtgtgtgcg 1080 tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc cctgcacccc 1140 cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc ggggcgtggc 1200 gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 1260 ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gccccggagc gccggcggct 1320 gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 1380 gacttccttt gtcccaaatc tggcggagcc gaaatctggg aggcgccgcc gcaccccctc 1440 tagcgggcgc gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt 1500 cgtgcgtcgc cgcgccgccg tccccttctc catctccagc ctcggggctg ccgcaggggg 1560 acggctgcct tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg 1620 gctctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1680 acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attcgccacc atgggtgcga 1740 gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg ttaaggccag 1800 ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag ctagaacgat 1860 tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata ctgggacagc 1920 tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acagtagcaa 1980 ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct ttagacaaga 2040 tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct gacacaggac 2100 acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg caaatggtac 2160 atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa gagaaggctt 2220 tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc ccacaagatt 2280 taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg ttaaaagaga 2340 ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca gggcctattg 2400 caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact agtacccttc 2460 aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa atctataaaa 2520 gatggataat cctgggatta aataaaatag taagaatgta tagccctacc agcattctgg 2580 acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc tataaaactc 2640 taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc ttgttggtcc 2700 aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga gcgacactag 2760 aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca agagttttgg 2820 ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa ggcaatttta 2880 ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac atagccaaaa 2940 attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga caccaaatga 3000 aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc cacaagggaa 3060 ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa gagagcttca 3120 ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac aaggaactgt 3180 atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa aactttagcc 3240 agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc tctagacaag 3300 agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 3360 ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 3420 agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 3480 gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 3540 acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 3600 ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 3660 tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 3720 aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 3780 agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 3840 catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 3900 gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 3960 gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 4020 agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 4080 ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 4140 cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 4200 tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 4260 tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 4320 attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 4380 aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 4440 gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc 4500 tgaagcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 4560 agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 4620 ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 4680 ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 4740 tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 4800 tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 4860 gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 4920 tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 4980 agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 5040 tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 5100 gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 5160 acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 5220 aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga 5280 atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 5340 actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 5400 ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 5460 acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 5520 tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 5580 gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 5640 tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 5700 agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 5760 gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 5820 agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag aacgtcgtga 5880 aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 5940 gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 6000 gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 6060 aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 6120 accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 6180 gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 6240 agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttcc tttagcttcc 6300 ctcagatcac tctttggcag cgacccctcg tcacaataaa gatagggggg caattaaagg 6360 aagctctatt agatacagga gcagatgata cagtattaga agaaatgaat ttgccaggaa 6420 gatggaaacc aaaaatgata gggggaattg gaggttttat caaagtaaga cagtatgatc 6480 agatactcat agaaatctgc ggacataaag ctataggtac agtattagta ggacctacac 6540 ctgtcaacat aattggaaga aatctgttga ctcagattgg ctgcacttta aatttttgac 6600 tagcagatct ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc 6660 tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt 6720 gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag aatgagtatt 6780 tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa ggttggctat 6840 aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc catagaaaag 6900 ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt tctttaacat 6960 ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc tgactactcc 7020 cagtcatagc tgtccctctt ctcttatgaa gatccctcga cctgcagccc aagcttggcg 7080 taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 7140 atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 7200 ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagcggatc 7260 cgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 7320 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 7380 aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 7440 gcctaggctt ttgcaaaaag ctaacttgtt tattgcagct tataatggtt acaaataaag 7500 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 7560 gtccaaactc atcaatgtat cttatcatgt ctggatccgc tgcattaatg aatcggccaa 7620 cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 7680 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 7740 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 7800 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 7860 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 7920 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 7980 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 8040 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8100 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 8160 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 8220 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 8280 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 8340 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 8400 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 8460 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 8520 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 8580 acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 8640 tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 8700 ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 8760 ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 8820 tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 8880 aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 8940 ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 9000 ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 9060 gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 9120 gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 9180 cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 9240 actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 9300 ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 9360 tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 9420 ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 9480 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 9540 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctg 9586 <210> 824 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer sequence <400> 824 gtgtagtaca agagatagaa 20 <210> 825 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer sequence <400> 825 ctgcattcta gttgtggttt 20 <210> 826 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer sequence <400> 826 ggccgagatg tctcgctccg 20 <210> 827 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer sequence <400> 827 cgagacgtaa ttacgtctcg 20 <210> 828 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> sequence encoding gRNA <400> 828 actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60 aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggttt 109 <210> 829 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> sequence encoding gRNA <400> 829 actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60 aagctccctc ttcggaggga gcatcaaagc gagacgtaat tacgtctcg 109 <210> 830 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 glycoprotein <400> 830 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 831 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 831 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 <210> 832 <211> 4620 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-(-1)-POL plasmid sequence <400> 832 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800 caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860 tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920 atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980 tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040 taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100 catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160 gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220 aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280 aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340 aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400 ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460 tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520 tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580 ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640 cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700 tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760 aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820 atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880 aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940 aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000 gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060 taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120 aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180 atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240 acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300 aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360 catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420 ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480 aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540 aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600 tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660 tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720 ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780 atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840 ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900 tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960 cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020 acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080 aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140 tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200 atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260 agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320 gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380 tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440 caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500 gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560 agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620 <210> 833 <211> 4805 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence <400> 833 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800 aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860 gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920 cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980 ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040 agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100 gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160 acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220 tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280 gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340 actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400 acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460 gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520 tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580 gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640 ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700 tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760 gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820 gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880 agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940 ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000 accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060 tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120 agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180 tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240 gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300 ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360 tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420 aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480 acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540 acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600 tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660 tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720 tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780 gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840 cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900 gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960 gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020 acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080 atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140 ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200 tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260 ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320 ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380 agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440 tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500 agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560 agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620 gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680 ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740 tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800 acgct 4805 <210> 834 <211> 4869 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X-PR plasmid sequence <400> 834 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620 gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680 aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740 agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800 gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860 ttaaatttt 4869 <210> 835 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 835 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 <210> 836 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-X plasmid sequence <400> 836 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 <210> 837 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 837 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 838 <211> 4338 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X (no p1/p6) plasmid sequence <400> 838 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgct 4338 <210> 839 <211> 4395 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1-X plasmid sequence <400> 839 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380 gtccctgact acgct 4395 <210> 840 <211> 4814 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X-(-1)-PR plasmid sequence <400> 840 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380 ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440 ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500 ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560 taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620 aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680 aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740 tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800 gcactttaaa tttt 4814 <210> 841 <211> 4649 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-(-1)-PR plasmid sequence <400> 841 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200 tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260 ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320 ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380 tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440 atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500 ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560 aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620 tgactcagat tggctgcact ttaaatttt 4649 <210> 842 <211> 4151 <212> DNA <213> Artificial Sequence <220> <223> MA-X-NC-(-1)-PR <400> 842 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480 gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540 aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600 aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660 aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720 aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780 aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840 tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900 gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960 tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020 taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080 tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140 ctttaaattt t 4151 <210> 843 <211> 3926 <212> DNA <213> Artificial Sequence <220> <223> MA-X-(-1)-PR plasmid sequence <400> 843 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480 ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540 ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600 atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660 tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720 cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780 gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840 ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900 ctcagattgg ctgcacttta aatttt 3926 <210> 844 <211> 3759 <212> DNA <213> Artificial Sequence <220> <223> MA-X-PR plasmid sequence <400> 844 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480 cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540 ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600 atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660 tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720 agaaatctgt tgactcagat tggctgcact ttaaatttt 3759 <210> 845 <211> 4482 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-PR plasmid sequence <400> 845 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200 tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260 acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320 atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380 atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440 ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482 <210> 846 <211> 3450 <212> DNA <213> Artificial Sequence <220> <223> MA-X plasmid sequence <400> 846 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct 3450 <210> 847 <211> 4173 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X plasmid sequence <400> 847 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gct 4173 <210> 848 <211> 4338 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X plasmid sequence <400> 848 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgct 4338 <210> 849 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 849 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 850 <211> 4395 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1-X plasmid sequence <400> 850 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380 gtccctgact acgct 4395 <210> 851 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 851 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 852 <211> 4814 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X-(-1)-PR plasmid sequence <400> 852 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320 gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380 ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440 ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500 ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560 taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620 aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680 aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740 tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800 gcactttaaa tttt 4814 <210> 853 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 853 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 854 <211> 4649 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-(-1)-PR plasmid sequence <400> 854 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200 tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260 ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320 ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380 tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440 atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500 ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560 aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620 tgactcagat tggctgcact ttaaatttt 4649 <210> 855 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 855 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 856 <211> 4151 <212> DNA <213> Artificial Sequence <220> <223> MA-X-NC-(-1)-PR plasmid sequence <400> 856 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480 gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540 aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600 aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660 aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720 aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780 aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840 tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900 gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960 tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020 taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080 tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140 ctttaaattt t 4151 <210> 857 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 857 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 858 <211> 3926 <212> DNA <213> Artificial Sequence <220> <223> MA-X-(-1)-PR plasmid sequence <400> 858 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480 ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540 ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600 atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660 tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720 cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780 gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840 ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900 ctcagattgg ctgcacttta aatttt 3926 <210> 859 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 859 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 860 <211> 3759 <212> DNA <213> Artificial Sequence <220> <223> MA-X-PR plasmid sequence <400> 860 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480 cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540 ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600 atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660 tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720 agaaatctgt tgactcagat tggctgcact ttaaatttt 3759 <210> 861 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 861 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 862 <211> 4482 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-PR plasmid sequence <400> 862 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200 tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260 acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320 atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380 atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440 ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482 <210> 863 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 863 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 864 <211> 3450 <212> DNA <213> Artificial Sequence <220> <223> MA-X plasmid sequence <400> 864 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480 atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540 aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600 aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660 ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720 cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780 cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840 tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900 aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960 ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020 tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080 gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140 ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200 atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260 gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320 gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380 ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440 ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500 tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560 ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620 aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680 aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740 gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800 tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860 aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920 gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980 ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040 ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100 gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160 cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220 ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280 ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340 gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400 aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460 gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520 acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580 aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640 aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700 caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760 acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820 tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880 tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940 aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000 cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060 ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120 tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180 ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240 gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300 accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360 ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420 gagtacccat atgatgtccc tgactacgct 3450 <210> 865 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 865 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 866 <211> 4173 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X plasmid sequence <400> 866 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gct 4173 <210> 867 <211> 1503 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6 plasmid sequence <400> 867 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taa 1503 <210> 868 <211> 4356 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-P1/P6-X plasmid sequence <400> 868 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgt ttttagggaa gatctggcct tcccacaagg gaaggccagg gaattttctt 1140 cagagcagac cagagccaac agccccacca gaagagagct tcaggtttgg ggaagagaca 1200 acaactccct ctcagaagca ggagccgata gacaaggaac tgtatccttt agcttccctc 1260 agatcactct ttggcagcga cccctcgtca caaaacttta gccagaacta tccgattgtg 1320 cagaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1380 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1440 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1500 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1560 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1620 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1680 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1740 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1800 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1860 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1920 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1980 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 2040 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 2100 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 2160 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2220 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2280 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2340 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2400 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2460 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2520 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2580 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2640 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2700 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2760 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2820 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2880 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2940 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 3000 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 3060 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 3120 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3180 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3240 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3300 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3360 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3420 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3480 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3540 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3600 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3660 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3720 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3780 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3840 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3900 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3960 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 4020 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 4080 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 4140 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4200 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4260 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4320 ctcgagtacc catatgatgt ccctgactac gcttga 4356 <210> 869 <211> 4677 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-P1/P6-P1/P6-X plasmid sequence <400> 869 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggctttttag ggaagatctg gccttcccac aagggaaggc cagggaattt tcttcagagc 1200 agaccagagc caacagcccc accagaagag agcttcaggt ttggggaaga gacaacaact 1260 ccctctcaga agcaggagcc gatagacaag gaactgtatc ctttagcttc cctcagatca 1320 ctctttggca gcgacccctc gtcacaaaac tttagccaga actatccgat tgtgcagacc 1380 ggtgccccaa agaagaagcg gaaggtctct agatttttag ggaagatctg gccttcccac 1440 aagggaaggc cagggaattt tcttcagagc agaccagagc caacagcccc accagaagag 1500 agcttcaggt ttggggaaga gacaacaact ccctctcaga agcaggagcc gatagacaag 1560 gaactgtatc ctttagcttc cctcagatca ctctttggca gcgacccctc gtcacaaaac 1620 tttagccaga actatccgat tgtgcagacc ggtgccccaa agaagaagcg gaaggtctct 1680 agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1740 aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1800 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1860 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1920 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1980 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 2040 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 2100 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2160 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2220 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2280 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2340 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2400 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2460 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2520 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2580 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2640 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2700 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2760 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2820 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2880 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2940 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 3000 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 3060 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3120 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3180 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3240 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3300 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3360 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3420 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3480 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3540 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3600 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3660 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3720 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3780 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3840 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3900 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3960 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 4020 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 4080 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4140 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4200 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4260 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4320 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4380 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4440 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4500 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4560 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4620 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4677 <210> 870 <211> 4764 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-P1/P6-P1/P6-X plasmid sequence <400> 870 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 tttttaggga agatctggcc ttcccacaag ggaaggccag ggaattttct tcagagcaga 1560 ccagagccaa cagccccacc agaagagagc ttcaggtttg gggaagagac aacaactccc 1620 tctcagaagc aggagccgat agacaaggaa ctgtatcctt tagcttccct cagatcactc 1680 tttggcagcg acccctcgtc acaaaacttt agccagaact atccgattgt gcagaccggt 1740 gccccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1800 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1860 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1920 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1980 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2040 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2100 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2160 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2220 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2280 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2340 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2400 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2460 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2520 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2580 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2640 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2700 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2760 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2820 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2880 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2940 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3000 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3060 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3120 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3180 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3240 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3300 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3360 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3420 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3480 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3540 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3600 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3660 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3720 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3780 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3840 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3900 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3960 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4020 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4080 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4140 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4200 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4260 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4320 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4380 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4440 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4500 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4560 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4620 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4680 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4740 ccatatgatg tccctgacta cgct 4764 <210> 871 <211> 4398 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-X-P1/P6 plasmid sequence <400> 871 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcatgcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200 aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260 atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320 agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380 aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440 ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500 gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560 gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620 ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680 ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740 aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800 cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860 gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920 atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980 ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040 aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100 aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160 ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220 gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280 aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340 cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400 aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460 aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520 caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580 ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640 ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700 ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760 aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820 cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880 gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940 ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000 tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060 caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120 agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180 atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240 cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300 aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360 aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420 acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480 agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540 gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600 acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660 ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720 ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780 gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840 agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900 aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960 attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020 accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080 aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140 ctcgagtacc catatgatgt ccctgactac gctggcggtg gaagacaggc taatttttta 4200 gggaagatct ggccttccca caagggaagg ccagggaatt ttcttcagag cagaccagag 4260 ccaacagccc caccagaaga gagcttcagg tttggggaag agacaacaac tccctctcag 4320 aagcaggagc cgatagacaa ggaactgtat cctttagctt ccctcagatc actctttggc 4380 agcgacccct cgtcacaa 4398 <210> 872 <211> 4275 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-NC-X-P1/P6 plasmid sequence <400> 872 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260 tggaagcccg ccgtg 4275 <210> 873 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> MA-CA-P2-P1/P6-X plasmid sequence <400> 873 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560 tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620 acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680 gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740 agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800 gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860 gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920 aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980 tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040 aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100 gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160 atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220 agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280 agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340 cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400 gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460 gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520 gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580 gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640 aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700 aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760 ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820 gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880 gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940 gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000 tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060 gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120 tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180 ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240 gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300 cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360 aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420 aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480 ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540 gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600 agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660 aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720 tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780 gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840 agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900 atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960 aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020 gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080 atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140 cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200 aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260 aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320 cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380 gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440 gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500 agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560 <210> 874 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 874 Ser Ala Val His Ser Val Arg Leu 1 5 <210> 875 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 875 Arg Thr Val Asn Thr Val Arg Val 1 5 <210> 876 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 876 Asn Thr Val His Thr Val Arg Gln Val Glu Ser 1 5 10 <210> 877 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 877 Ala Ala Val His Thr Val Lys Ala 1 5 <210> 878 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 878 Arg Thr Val Asn Thr Val Thr Thr 1 5 <210> 879 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 879 Arg Ser Val Asn Thr Val Thr Ala 1 5 <210> 880 <211> 2413 <212> DNA <213> Artificial Sequence <220> <223> pStx42.174.12.7 plasmid sequence <400> 880 gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60 tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360 aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660 ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020 caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800 ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860 gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040 tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100 gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280 acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340 gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400 tttttttgaa ttc 2413 <210> 881 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 881 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 882 <211> 5178 <212> DNA <213> Artificial Sequence <220> <223> pXDP40 plasmid sequence <400> 882 atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60 ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120 agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180 agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240 ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300 ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360 cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420 ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480 atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540 tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660 gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720 gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780 ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840 gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960 gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020 aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080 gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140 gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200 gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260 cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320 cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380 gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440 agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500 tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560 cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620 atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680 cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cctggctatg 1740 accatggaac acaaggaccg gcctctggtg cgggtgatcc tgacaaatac cggctctcac 1800 cccgtgaagc agcggtcagt gtacatcaca gccctgctgg acagcggcgc tgatatcacc 1860 atcattagcg aggaggactg gcctaccgac tggcccgtga tggaagctgc caatccccag 1920 atccacggca tcggaggcgg aatcccgatg agaaagtcca gagacatgat cgaggtgggc 1980 gtgatcaacc gggacggctc tcttgagaga cctctgctgc tgttccccgc cgtggctatg 2040 gtgcgaggca gcatcctggg ccgcgactgc ctgcagggcc tgggcctgag actgaccaac 2100 ctgaacttta gccagggtgc caccagctgc taccactgcg gcaccggcgg cagcccaaag 2160 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 2220 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 2280 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 2340 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 2400 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 2460 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2520 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2580 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2640 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2700 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2760 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2820 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2880 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2940 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 3000 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 3060 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 3120 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 3180 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 3240 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 3300 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 3360 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 3420 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3480 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3540 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3600 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3660 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3720 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3780 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3840 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3900 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3960 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 4020 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 4080 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 4140 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 4200 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 4260 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 4320 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 4380 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 4440 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4500 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4560 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4620 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4680 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4740 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4800 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4860 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4920 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4980 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 5040 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 5100 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 5160 gtccctgact acgcttga 5178 <210> 883 <211> 5187 <212> DNA <213> Artificial Sequence <220> <223> pXDP41 plasmid sequence <400> 883 atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60 ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120 agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180 cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240 ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300 ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360 agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420 cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480 attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540 tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660 gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720 gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780 ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840 gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960 gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020 aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080 gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140 gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200 gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260 cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320 caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380 gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440 tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500 tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560 cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620 atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680 agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cctggctatg 1740 accatggaac acaaggacag acccctggtg cgggtgatcc tgacaaacac cggaagccac 1800 cccgtgaagc agcgctccgt gtacatcaca gcccttctgg acagcggcgc cgacatcacc 1860 atcatcagcg aggaagattg gcctacagac tggcctgtga tggaagccgc aaacccccag 1920 atccacggca tcggcggagg tatacccatg cggaagagca gagacatgat cgagctgggc 1980 gtgatcaacc gggacggcag cctggaacgg cccctgctgt tgtttcctgc tgtggctatg 2040 gtgcggggaa gcatcctggg cagagattgc ctgcagggcc tgggcctgcg cctgaccaac 2100 ctgtgaggag ggccactgtt ctcaggtgcc acatcttgtt accactgcgg caccggcggc 2160 agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 2220 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 2280 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 2340 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 2400 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2460 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2520 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2580 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2640 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2700 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2760 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2820 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2880 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2940 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 3000 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 3060 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 3120 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 3180 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 3240 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 3300 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 3360 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3420 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3480 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3540 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3600 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3660 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3720 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3780 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3840 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3900 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3960 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 4020 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 4080 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 4140 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 4200 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 4260 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 4320 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 4380 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4440 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4500 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4560 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4620 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4680 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4740 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4800 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4860 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4920 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4980 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 5040 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 5100 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 5160 ccatatgatg tccctgacta cgcttga 5187 <210> 884 <211> 5684 <212> DNA <213> Artificial Sequence <220> <223> pXDP42 plasmid sequence <400> 884 atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60 agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120 tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180 cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240 ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300 aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360 gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420 ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480 tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540 ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600 aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660 gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720 agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780 gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840 atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900 ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960 ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020 aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080 gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140 agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200 cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260 aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320 gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380 tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440 gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500 ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560 gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cccgcgctgt 1620 aaaaaaggaa agcattgggc acgagattgc cggtccaaaa cagatgttca aggtacccct 1680 ttacccccgg tgtcgggaaa ctgggtgagg ggccagcccc tggccccgaa acaatgttat 1740 ggggcaacac tgcaggttcc aaaagaacca ttgcagacct ctgtcgagcc acaagaggca 1800 gcgcgggatt ggacctctgt gccacctcct acacagtatt aactcccgag atgggggtcc 1860 aaaccctggc tacaggcgtg ttcggtcctc tgccccccgg caccgccggc ctgctgctgg 1920 gcagaagcag cgccagcctg aagggcatcc tgatccatcc tggagtgatt gacagcgact 1980 acaccggcga gatcaagatc ctggcctctg cccctaacaa gatcatcgtg atcaacgccg 2040 gccaaagaat cgcccagctg ctgctcgtgc ctctggtgat ccagggcaaa accatcaacc 2100 gggacaggca ggacaaggga tttggatctt ctgacgccta ttgggtgcag aacgtgaccg 2160 aggccagacc tgaactggaa cttagaatca atggcaagct gttccggggc gtgctggata 2220 caggcgccga catcagcgtg atcagcgaca aatactggcc caccacctgg cctaagcaga 2280 tggctatctc tacactgcag ggcatcggcc agacaaccaa ccccgagcag agcagcagcc 2340 tgctgacctg gaaggacaag gacggccaca ccggccaatt caagccctac atcctgcctc 2400 acctgcctgt gaacctgtgg ggcagagata tcctgagcaa gatgggcgtc tacctgtact 2460 cccctagccc taccgtgaca gatctgatgc tggaccaggg cctgctgcct aatcagggcc 2520 tcggaaagca acaccaggga attatcctgc cactggacct gaaaagcaac caggatagaa 2580 agggcctggg atgcttcccc tgaggacctc tgattctcct gggtgccgac tgcctggatt 2640 tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa gagatcaaga 2700 gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag gccggcaaga 2760 caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga gagcggctgg 2820 aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc agcagggcca 2880 acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg cacgtgtact 2940 gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag cctgccagca 3000 agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat ctgaccacag 3060 ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt 3120 ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc gagcacgaga 3180 agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc gtgacctaca 3240 gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg accaaagaaa 3300 gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc tctggacctg 3360 tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc 3420 aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc 3480 tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg cctcctcagc 3540 ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg agaatgtggg 3600 tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag cctctgctga 3660 gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa gtggattggt 3720 gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat ggcaaggttt 3780 tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac ctgagcagcg 3840 aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac ctgctgctgc 3900 acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc tgggagagaa 3960 tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa agaaggagcg 4020 aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc agctttgtga 4080 tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg aagctgcaga 4140 agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac agcatcctgg 4200 acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa gacggcgtca 4260 agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg cggttcaaga 4320 agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac aaaaagtccg 4380 gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg attatcctgc 4440 ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg ctgagcctgg 4500 aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg tacaacagga 4560 gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga agagaggtgc 4620 tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc gagaatatcc 4680 ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc aaggactccc 4740 tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag cagaggacaa 4800 tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg aagtacgcca 4860 gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat ctgctgtact 4920 acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc ttcggccggc 4980 agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat tggctcacag 5040 ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg gcccagtata 5100 cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac gacagagtgc 5160 tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc aaagagctga 5220 aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc gtgaaggatc 5280 tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc agcagctgga 5340 caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc cacagacctg 5400 tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat gaacaggctg 5460 ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag aagtaccaga 5520 ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg cagagcttct 5580 acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa 5640 aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5684 <210> 885 <211> 5637 <212> DNA <213> Artificial Sequence <220> <223> pXDP43 plasmid sequence <400> 885 atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60 tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120 aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180 ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240 tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300 agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360 agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420 accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480 gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540 gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600 aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660 cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720 gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780 gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840 gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900 cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960 tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020 gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080 aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140 tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200 gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260 ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320 atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380 tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440 agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500 agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560 ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620 aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680 taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740 ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800 agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860 ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920 gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980 atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040 gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100 aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160 atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca ctgggtgcag 2220 gagatcagcg acagcagacc catgctgcac atcagcctga acggcagaag attcctgggc 2280 ctgctggaca ccggggccga taagacctgc atcgccggca gagattggcc cgccaactgg 2340 cctattcacc agaccgagag cagcctgcag ggcttgggaa tggcttgtgg cgtggctaga 2400 agctctcagc ctctgagatg gcagcacgag gataagtctg gcattatcca tcctttcgtg 2460 atccccacat tgccttttac cctctggggc cgggacatca tgaaagagat aaaggtgcgg 2520 ctgatgaccg atagcccaga cgacagccag gatctgacat ctctgtacgg cttaggtgcc 2580 gacctggtgc tgctgagcgc cgagggcggc agcccaaaga agaagcggaa ggtctctaga 2640 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2700 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2760 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2820 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2880 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2940 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 3000 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 3060 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 3120 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 3180 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 3240 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 3300 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 3360 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 3420 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 3480 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 3540 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 3600 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3660 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3720 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3780 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3840 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3900 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3960 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 4020 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 4080 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 4140 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 4200 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 4260 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 4320 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 4380 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 4440 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 4500 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 4560 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 4620 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4680 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4740 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4800 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4860 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4920 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4980 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 5040 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 5100 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 5160 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 5220 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 5280 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 5340 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 5400 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 5460 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 5520 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 5580 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 5637 <210> 886 <211> 5811 <212> DNA <213> Artificial Sequence <220> <223> pXDP44 plasmid sequence <400> 886 atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60 acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120 acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180 gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240 agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300 gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360 accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420 tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480 ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540 gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600 agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660 cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720 ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780 caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840 aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900 gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960 gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020 ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080 gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140 tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200 accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260 gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320 ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380 agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440 aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500 aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560 cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620 aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680 aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740 tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800 ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860 caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920 agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc ctgaaatggg 1980 gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040 cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100 tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160 tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220 acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccagcc 2280 tatcacctgt cagaagcctt ctctgaccct gtggctggac gacaagatgt tcaccggcct 2340 catcgacacc ggcgccgacg tgacaatcat caagctggaa gattggcctc caaattggcc 2400 cattacagat accctgacca acctgagagg catcggacag tccaacaacc ccaagcagag 2460 cagcaagtac ctgacatggc gggacaagga gaacaacagc ggcctgatca aaccttttgt 2520 gatccccaat ctgcctgtga acctgtgggg aagagatctg ctgtctcaga tgaagatcat 2580 gatgtgcagc ccaaacgaca tcgtgaccgc ccagatgctg gctcaaggct acagccccgg 2640 caaaggcctg ggcaagaaag agaatggaat cctgcaccct atccctaacc agggccagag 2700 caacaagaag ggcttcggca acttctgact gcggccattg acatacttgg tgccccacag 2760 gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811 <210> 887 <211> 4779 <212> DNA <213> Artificial Sequence <220> <223> pXDP45 plasmid sequence <400> 887 atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60 ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120 aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180 ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240 aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300 ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360 agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420 ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480 gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540 acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600 cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660 cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720 ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780 cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840 ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900 aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960 gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020 aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080 ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140 tggaagcgcg attgtcccac actgaagtcc aagaattaat agagggggga cttagcgccc 1200 cccaaaccat aacacctata acagattctc ttagtgaggc cgaattagaa tgcttactct 1260 ctattcctct ggcccggagc cgccctagcg tggccgtgta cctgagcggc ccttggctgc 1320 aaccttctca gaaccaggcc ctgatgctgg ttgatacagg cgccgagaac accgtgctgc 1380 ctcagaattg gctggtgcgg gactacccca gaatccctgc cgctgtgctg ggagccggag 1440 gcgtgtcccg gaacagatac aactggctgc agggccctct tacactggct ctgaaacctg 1500 aaggcccatt catcaccatc ccaaagatcc tggtcgacac cttcgacaag tggcagatcc 1560 tgggcagaga tgtgctgagc agactgcagg ccagcatcag catccccgag gaagtgcggc 1620 cccccgtggt gggcgtcttg gatgcccccc cgagccacat tggattagaa catctgcccc 1680 ccccacctga ggtgcctcaa ttccctttaa actagaggtg ccccagccat cctgcccatc 1740 atctccggcg gcagcccaaa gaagaagcgg aaggtctcta gacaagagat caagagaatc 1800 aacaagatca gaaggagact ggtcaaggac agcaacacaa agaaggccgg caagacaggc 1860 cccatgaaaa ccctgctcgt cagagtgatg acccctgacc tgagagagcg gctggaaaac 1920 ctgagaaaga agcccgagaa catccctcag cctatcagca acaccagcag ggccaacctg 1980 aacaagctgc tgaccgacta caccgagatg aagaaagcca tcctgcacgt gtactgggaa 2040 gagttccaga aagaccccgt gggcctgatg agcagagttg ctcagcctgc cagcaagaag 2100 atcgaccaga acaagctgaa gcccgagatg gacgagaagg gcaatctgac cacagccggc 2160 tttgcctgct ctcagtgtgg ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag 2220 aaaggcaagg cctacaccaa ctacttcggc agatgtaacg tggccgagca cgagaagctg 2280 attctgctgg cccagctgaa acctgagaag gactctgatg aggccgtgac ctacagcctg 2340 ggcaagtttg gacagagagc cctggacttc tacagcatcc acgtgaccaa agaaagcaca 2400 caccccgtga agcccctggc tcagatcgcc ggcaatagat acgcctctgg acctgtgggc 2460 aaagccctgt ccgatgcctg catgggaaca atcgccagct tcctgagcaa gtaccaggac 2520 atcatcatcg agcaccagaa ggtggtcaag ggcaaccaga agagactgga aagcctgagg 2580 gagctggccg gcaaagagaa cctggaatac cccagcgtga ccctgcctcc tcagcctcac 2640 acaaaagaag gcgtggacgc ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac 2700 ctgaacctgt ggcagaagct gaaactgtcc agggacgacg ccaagcctct gctgagactg 2760 aagggcttcc ctagcttccc tctggtggaa agacaggcca atgaagtgga ttggtgggac 2820 atggtctgca acgtgaagaa gctgatcaac gagaagaaag aggatggcaa ggttttctgg 2880 cagaacctgg ccggctacaa gagacaagaa gccctgaggc cttacctgag cagcgaagag 2940 gaccggaaga agggcaagaa gttcgccaga taccagctgg gcgacctgct gctgcacctg 3000 gaaaagaagc acggcgagga ctggggcaaa gtgtacgatg aggcctggga gagaatcgac 3060 aagaaggtgg aaggcctgag caagcacatt aagctggaag aggaaagaag gagcgaggac 3120 gcccaatcta aagccgctct gaccgattgg ctgagagcca aggccagctt tgtgatcgag 3180 ggcctgaaag aggccgacaa ggacgagttc tgcagatgcg agctgaagct gcagaagtgg 3240 tacggcgatc tgagaggcaa gcccttcgcc attgaggccg agaacagcat cctggacatc 3300 agcggcttca gcaagcagta caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa 3360 ctgaacctgt acctgatcat caattacttc aaaggcggca agctgcggtt caagaagatc 3420 aaacccgagg ccttcgaggc taacagattc tacaccgtga tcaacaaaaa gtccggcgag 3480 atcgtgccca tggaagtgaa cttcaacttc gacgacccca acctgattat cctgcctctg 3540 gccttcggca agagacaggg cagagagttc atctggaacg atctgctgag cctggaaacc 3600 ggctctctga agctggccaa tggcagagtg atcgagaaaa ccctgtacaa caggagaacc 3660 agacaggacg agcctgctct gtttgtggcc ctgaccttcg agagaagaga ggtgctggac 3720 agcagcaaca tcaagcccat gaacctgatc ggcgtggacc ggggcgagaa tatccctgct 3780 gtgatcgccc tgacagaccc tgaaggatgc ccactgagca gattcaagga ctccctgggc 3840 aaccctacac acatcctgag aatcggcgag agctacaaag agaagcagag gacaatccag 3900 gccaagaaag aggtggaaca gagaagagcc ggcggatact ctaggaagta cgccagcaag 3960 gccaagaatc tggccgacga catggtccga aacaccgcca gagatctgct gtactacgcc 4020 gtgacacagg acgccatgct gatcttcgag aatctgagca gaggcttcgg ccggcagggc 4080 aagagaacct ttatggccga gaggcagtac accagaatgg aagattggct cacagctaaa 4140 ctggcctacg agggactgag caagacctac ctgtccaaaa cactggccca gtatacctcc 4200 aagacctgca gcaattgcgg cttcaccatc accagcgccg actacgacag agtgctggaa 4260 aagctcaaga aaaccgccac cggctggatg accaccatca acggcaaaga gctgaaggtt 4320 gagggccaga tcacctacta caacaggtac aagaggcaga acgtcgtgaa ggatctgagc 4380 gtggaactgg acagactgag cgaagagagc gtgaacaacg acatcagcag ctggacaaag 4440 ggcagatcag gcgaggctct gagcctgctg aagaagaggt ttagccacag acctgtgcaa 4500 gagaagttcg tgtgcctgaa ctgcggcttc gagacacacg ccgatgaaca ggctgccctg 4560 aacattgcca gaagctggct gttcctgaga agccaagagt acaagaagta ccagaccaac 4620 aagaccaccg gcaacaccga caagagggcc tttgtggaaa cctggcagag cttctacaga 4680 aaaaagctga aagaagtctg gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta 4740 gccctcgagt acccatatga tgtccctgac tacgcttga 4779 <210> 888 <211> 5078 <212> DNA <213> Artificial Sequence <220> <223> pXDP46 plasmid sequence <400> 888 atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60 gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120 tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180 tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240 aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300 cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360 tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420 aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480 gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540 acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600 caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660 aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720 agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780 ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840 ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900 tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960 accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020 accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080 ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140 cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttaa cctctcctcc taccctgcag caggtgttcc 1320 tgaatcaaga tcctgccagc atcctgcctg tgatccccct cgaccccgct agaagacctg 1380 tgatcaaggc ccaggtggac acacagacct cccaccccaa aacaatcgag gccctgctgg 1440 acaccggcgc tgatatgaca gtgctgccaa tcgccctgtt cagcagcaac acccctctga 1500 aaaacaccag cgtgctcgga gccggcggac agacccagga ccacttcaag ctgacaagcc 1560 tgcctgtcct gatccggctg cccttcagaa ccacacctat cgtgctgacc agctgcctgg 1620 tggacacaaa gaacaactgg gccatcatcg gcagggacgc cctgcaacag tgccagggcg 1680 tgctgtacct gccagaggcc aagggccccc ccgttatcct gcctatccag gcccctgccg 1740 tgctgggcct ggaacacctg ccaagacccc cccagatcag ccaatttcct ctgaaccaga 1800 acgccagcag accatgtaat acctggtccg gcagaccttg gcggcaggcc atttctaacc 1860 ccacccccgg ccaggagatc acccagtaca gccagctgaa gcggcctatg gaacctggag 1920 attctagcac cacctgcggc cctctgacac tgtgaccata gacctctcat catcttcccc 1980 cgggccccct gacttgtcca gcctgccaac cacacggtgc ccctcaagtg ctgccagtga 2040 tgcacggcgg cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca 2100 acaagatcag aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc 2160 ccatgaaaac cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc 2220 tgagaaagaa gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga 2280 acaagctgct gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag 2340 agttccagaa agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga 2400 tcgaccagaa caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct 2460 ttgcctgctc tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga 2520 aaggcaaggc ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga 2580 ttctgctggc ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg 2640 gcaagtttgg acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac 2700 accccgtgaa gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca 2760 aagccctgtc cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca 2820 tcatcatcga gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg 2880 agctggccgg caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca 2940 caaaagaagg cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc 3000 tgaacctgtg gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga 3060 agggcttccc tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca 3120 tggtctgcaa cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc 3180 agaacctggc cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg 3240 accggaagaa gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg 3300 aaaagaagca cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca 3360 agaaggtgga aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg 3420 cccaatctaa agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg 3480 gcctgaaaga ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt 3540 acggcgatct gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca 3600 gcggcttcag caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac 3660 tgaacctgta cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca 3720 aacccgaggc cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga 3780 tcgtgcccat ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg 3840 ccttcggcaa gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg 3900 gctctctgaa gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca 3960 gacaggacga gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca 4020 gcagcaacat caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg 4080 tgatcgccct gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca 4140 accctacaca catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg 4200 ccaagaaaga ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg 4260 ccaagaatct ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg 4320 tgacacagga cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca 4380 agagaacctt tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac 4440 tggcctacga gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca 4500 agacctgcag caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa 4560 agctcaagaa aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg 4620 agggccagat cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg 4680 tggaactgga cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg 4740 gcagatcagg cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag 4800 agaagttcgt gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga 4860 acattgccag aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca 4920 agaccaccgg caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa 4980 aaaagctgaa agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag 5040 ccctcgagta cccatatgat gtccctgact acgcttga 5078 <210> 889 <211> 5244 <212> DNA <213> Artificial Sequence <220> <223> pXDP47 plasmid sequence <400> 889 atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60 accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120 aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180 gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240 cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300 aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360 acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420 aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480 ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540 aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600 gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660 aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720 aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780 ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840 aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900 atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960 acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020 aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080 accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140 gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200 aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260 gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320 cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380 gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440 tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500 aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560 aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620 cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680 ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740 cctgcatgag acccaatcga ttgcccctat gagaagagcg gcacaaagac cacacaggac 1800 gtgatcacca caaagaatgc cgagatcatg gtgaccgtga accacacaaa gatcccaatg 1860 ctggtggata ccggcgcctg tctgacagca atcggaggag cagcaaccgt ggtgccagac 1920 ctgaagctga ccaacacaga gatcatcgca gtgggaatct ctgccgagcc cgtgcctcac 1980 gtgctggcca agccaaccaa gatccagatc gagaacacaa atatcgatat cagcccttgg 2040 tacaatccag accagacctt ccacatcctg ggccgcgaca cactgtctaa gatgcgggcc 2100 atcgtgagct ttgagaagaa cggcgagatg accgtgctgc tgcctccaac atatcacaag 2160 cagctgtcct gtcagaccaa gggtgccgca aggcagatga ccgcacacac aggcggcagc 2220 ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 2280 agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 2340 ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 2400 gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 2460 gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 2520 cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 2580 ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 2640 tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2700 accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2760 ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2820 agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2880 ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2940 gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 3000 cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 3060 gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 3120 gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 3180 aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 3240 ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 3300 aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 3360 tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 3420 aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 3480 gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 3540 ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 3600 gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3660 gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3720 ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3780 cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3840 atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3900 gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3960 gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 4020 cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 4080 gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 4140 gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 4200 cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 4260 gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 4320 ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 4380 gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 4440 gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 4500 atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 4560 gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 4620 ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4680 tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4740 gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4800 tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4860 ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4920 gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4980 ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 5040 tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 5100 accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 5160 gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 5220 tatgatgtcc ctgactacgc ttga 5244 <210> 890 <211> 4962 <212> DNA <213> Artificial Sequence <220> <223> pXDP48 plasmid sequence <400> 890 atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60 gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120 gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180 atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240 ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300 ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360 cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420 ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480 cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540 tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600 gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660 aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720 atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780 accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840 ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900 tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960 gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020 cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080 tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140 taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200 acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260 gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320 atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380 aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440 aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500 ctgctgaacc tgggcgatca ggagagccaa ggccaggacc cccctcctga gcctagaatc 1560 accctgaaga ttggaggcca gcctgtgacc tttctggtgg acaccggcgc ccaacactct 1620 gtgctgacca gacctgatgg ccccctcagc gatagaaccg ccctggtcca gggagctaca 1680 ggcagcaaga actacagatg gaccaccgac agaagggtgc agctggctac tggcaaggtg 1740 acacacagct ttctgtacgt gcccgagtgc ccttaccccc tcctgggcag agatctgttg 1800 acaaagctga aggcccaaat ccacttcacc ggagagggcg ctaatgtggt gggccccaag 1860 ggcctgcctc ttcaggtgct gacactgcaa ctggaagagg gtgccagctc tctgtaccct 1920 gtgctgcctg gcggcagccc aaagaagaag cggaaggtct ctagacaaga gatcaagaga 1980 atcaacaaga tcagaaggag actggtcaag gacagcaaca caaagaaggc cggcaagaca 2040 ggccccatga aaaccctgct cgtcagagtg atgacccctg acctgagaga gcggctggaa 2100 aacctgagaa agaagcccga gaacatccct cagcctatca gcaacaccag cagggccaac 2160 ctgaacaagc tgctgaccga ctacaccgag atgaagaaag ccatcctgca cgtgtactgg 2220 gaagagttcc agaaagaccc cgtgggcctg atgagcagag ttgctcagcc tgccagcaag 2280 aagatcgacc agaacaagct gaagcccgag atggacgaga agggcaatct gaccacagcc 2340 ggctttgcct gctctcagtg tggccagcct ctgttcgtgt acaagctgga acaggtgtcc 2400 gagaaaggca aggcctacac caactacttc ggcagatgta acgtggccga gcacgagaag 2460 ctgattctgc tggcccagct gaaacctgag aaggactctg atgaggccgt gacctacagc 2520 ctgggcaagt ttggacagag agccctggac ttctacagca tccacgtgac caaagaaagc 2580 acacaccccg tgaagcccct ggctcagatc gccggcaata gatacgcctc tggacctgtg 2640 ggcaaagccc tgtccgatgc ctgcatggga acaatcgcca gcttcctgag caagtaccag 2700 gacatcatca tcgagcacca gaaggtggtc aagggcaacc agaagagact ggaaagcctg 2760 agggagctgg ccggcaaaga gaacctggaa taccccagcg tgaccctgcc tcctcagcct 2820 cacacaaaag aaggcgtgga cgcctacaac gaagtgatcg ccagagtgag aatgtgggtc 2880 aacctgaacc tgtggcagaa gctgaaactg tccagggacg acgccaagcc tctgctgaga 2940 ctgaagggct tccctagctt ccctctggtg gaaagacagg ccaatgaagt ggattggtgg 3000 gacatggtct gcaacgtgaa gaagctgatc aacgagaaga aagaggatgg caaggttttc 3060 tggcagaacc tggccggcta caagagacaa gaagccctga ggccttacct gagcagcgaa 3120 gaggaccgga agaagggcaa gaagttcgcc agataccagc tgggcgacct gctgctgcac 3180 ctggaaaaga agcacggcga ggactggggc aaagtgtacg atgaggcctg ggagagaatc 3240 gacaagaagg tggaaggcct gagcaagcac attaagctgg aagaggaaag aaggagcgag 3300 gacgcccaat ctaaagccgc tctgaccgat tggctgagag ccaaggccag ctttgtgatc 3360 gagggcctga aagaggccga caaggacgag ttctgcagat gcgagctgaa gctgcagaag 3420 tggtacggcg atctgagagg caagcccttc gccattgagg ccgagaacag catcctggac 3480 atcagcggct tcagcaagca gtacaactgc gccttcattt ggcagaaaga cggcgtcaag 3540 aaactgaacc tgtacctgat catcaattac ttcaaaggcg gcaagctgcg gttcaagaag 3600 atcaaacccg aggccttcga ggctaacaga ttctacaccg tgatcaacaa aaagtccggc 3660 gagatcgtgc ccatggaagt gaacttcaac ttcgacgacc ccaacctgat tatcctgcct 3720 ctggccttcg gcaagagaca gggcagagag ttcatctgga acgatctgct gagcctggaa 3780 accggctctc tgaagctggc caatggcaga gtgatcgaga aaaccctgta caacaggaga 3840 accagacagg acgagcctgc tctgtttgtg gccctgacct tcgagagaag agaggtgctg 3900 gacagcagca acatcaagcc catgaacctg atcggcgtgg accggggcga gaatatccct 3960 gctgtgatcg ccctgacaga ccctgaagga tgcccactga gcagattcaa ggactccctg 4020 ggcaacccta cacacatcct gagaatcggc gagagctaca aagagaagca gaggacaatc 4080 caggccaaga aagaggtgga acagagaaga gccggcggat actctaggaa gtacgccagc 4140 aaggccaaga atctggccga cgacatggtc cgaaacaccg ccagagatct gctgtactac 4200 gccgtgacac aggacgccat gctgatcttc gagaatctga gcagaggctt cggccggcag 4260 ggcaagagaa cctttatggc cgagaggcag tacaccagaa tggaagattg gctcacagct 4320 aaactggcct acgagggact gagcaagacc tacctgtcca aaacactggc ccagtatacc 4380 tccaagacct gcagcaattg cggcttcacc atcaccagcg ccgactacga cagagtgctg 4440 gaaaagctca agaaaaccgc caccggctgg atgaccacca tcaacggcaa agagctgaag 4500 gttgagggcc agatcaccta ctacaacagg tacaagaggc agaacgtcgt gaaggatctg 4560 agcgtggaac tggacagact gagcgaagag agcgtgaaca acgacatcag cagctggaca 4620 aagggcagat caggcgaggc tctgagcctg ctgaagaaga ggtttagcca cagacctgtg 4680 caagagaagt tcgtgtgcct gaactgcggc ttcgagacac acgccgatga acaggctgcc 4740 ctgaacattg ccagaagctg gctgttcctg agaagccaag agtacaagaa gtaccagacc 4800 aacaagacca ccggcaacac cgacaagagg gcctttgtgg aaacctggca gagcttctac 4860 agaaaaaagc tgaaagaagt ctggaagccc gccgtgacta gtccaaaaaa gaagagaaag 4920 gtagccctcg agtacccata tgatgtccct gactacgctt ga 4962 <210> 891 <211> 5061 <212> DNA <213> Artificial Sequence <220> <223> pXDP49 plasmid sequence <400> 891 atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60 cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120 gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180 atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240 ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300 gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360 cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420 aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480 gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540 gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600 aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660 ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720 aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780 atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840 gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900 cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960 tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020 ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080 cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140 ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200 tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260 ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320 gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380 cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440 gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500 cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560 cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgattgagga 1620 ggacagggac aggagccacc tccagagccc agaatcaccc tgaaggtcgg cggccagcct 1680 gtgacctttc tggtggacac aggcgcccag cacagcgtgc tgacccagaa tcccggccct 1740 ctgtctgata agagcgcctg ggtgcaggga gcaacaggcg gcaagcggta cagatggacc 1800 acagaccgga aggtgcacct ggccaccggc aaggtgacac acagctttct gcacgtgccc 1860 gactgtccat accccctgct gggcagagat ctgctgacca agctgaaggc acagatccac 1920 ttcgagggat ccggagcaca ggtcatggga ccaatgggac agcctctgca ggtgctgaca 1980 ctgaacatcg aggatgaggg tgccagctcc ctgtatcctg ccctgacagg cggcagccca 2040 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 2100 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 2160 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 2220 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2280 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2340 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2400 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2460 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2520 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2580 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2640 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2700 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2760 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2820 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2880 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2940 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 3000 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 3060 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 3120 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 3180 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3240 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3300 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3360 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3420 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3480 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3540 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3600 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3660 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3720 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3780 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3840 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3900 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3960 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 4020 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 4080 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 4140 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 4200 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4260 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4320 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4380 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4440 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4500 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4560 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4620 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4680 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4740 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4800 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4860 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4920 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4980 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 5040 gatgtccctg actacgcttg a 5061 <210> 892 <211> 4757 <212> DNA <213> Artificial Sequence <220> <223> pXDP50 plasmid sequence <400> 892 atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60 gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120 ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180 aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240 acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300 atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360 atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420 agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480 gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540 gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600 gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720 cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780 agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840 aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900 gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960 aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020 ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080 ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140 ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200 tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260 agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320 gtgccgtccg ctcctcctat ggaataacaa gcgcccctcc aatggtgcag gtgcggattg 1380 gatctcagca gcgcaacctg ctgttcgaca ccggcgccga tagaaccatc gtccggtggc 1440 acgagggctc cggcaacccc gccggcagaa tcaaactgca aggcatcggc ggaatcgtgg 1500 aaggcgagaa gtggaacaac gtggagctgg aatacaaggg cgagacaaga aagggcacca 1560 tcgtggtgct gcctcagagc cctgtggagg tgctgggacg ggacaacatg gcccggttcg 1620 gcatcaagat catcatggct aatctggagg aaaaaagaat ccccatcacc aaggtgaagt 1680 tgaaagaggg atgtggtgcc gcaggaggcc ggtcctggaa ggccggcggc agcccaaaga 1740 agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga aggagactgg 1800 tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc ctgctcgtca 1860 gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag cccgagaaca 1920 tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg accgactaca 1980 ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg 2040 gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac aagctgaagc 2100 ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct cagtgtggcc 2160 agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc tacaccaact 2220 acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc cagctgaaac 2280 ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga cagagagccc 2340 tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag cccctggctc 2400 agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc gatgcctgca 2460 tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag caccagaagg 2520 tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc aaagagaacc 2580 tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc gtggacgcct 2640 acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg cagaagctga 2700 aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct agcttccctc 2760 tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc 2820 tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc ggctacaaga 2880 gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag ggcaagaagt 2940 tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac ggcgaggact 3000 ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca 3060 agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa gccgctctga 3120 ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag gccgacaagg 3180 acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg agaggcaagc 3240 ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc aagcagtaca 3300 actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac ctgatcatca 3360 attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc ttcgaggcta 3420 acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact 3480 tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag agacagggca 3540 gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg 3600 gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag cctgctctgt 3660 ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc aagcccatga 3720 acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg acagaccctg 3780 aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac atcctgagaa 3840 tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag gtggaacaga 3900 gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg gccgacgaca 3960 tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac gccatgctga 4020 tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt atggccgaga 4080 ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag ggactgagca 4140 agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc aattgcggct 4200 tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa accgccaccg 4260 gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc acctactaca 4320 acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac agactgagcg 4380 aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc gaggctctga 4440 gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg tgcctgaact 4500 gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga agctggctgt 4560 tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc aacaccgaca 4620 agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa gaagtctgga 4680 agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg 4740 tccctgacta cgcttga 4757 <210> 893 <211> 4821 <212> DNA <213> Artificial Sequence <220> <223> pXDP51 plasmid sequence <400> 893 atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60 ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120 cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180 gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240 gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300 tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360 agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420 cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480 tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540 ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600 atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660 cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720 cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780 atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840 gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900 caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960 gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020 gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080 acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140 cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200 gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260 aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320 agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380 ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440 ctggacagtt tgtgggagta aacatataac ctggagaagc gccccaccac aatcgtgctg 1500 atcaacgaca cccctctgaa cgtgctgctg gacacaggag ctgatacatc tgtgctcacc 1560 accgcccact acaaccggct gaagtacaga ggcagaaagt accagggcac cggcatcatc 1620 ggcgtgggcg gaaatgtgga aaccttcagc accccagtga ccattaagaa aaagggccgg 1680 cacatcaaaa ccagaatgct ggtcgccgac atccctgtga caatcctggg cagagatatc 1740 cttcaggact taggtgcagg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1800 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1860 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1920 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1980 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2040 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2100 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2160 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2220 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2280 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2340 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2400 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2460 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2520 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2580 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2640 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2700 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2760 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2820 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2880 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2940 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3000 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3060 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3120 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3180 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3240 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3300 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3360 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3420 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3480 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3540 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3600 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3660 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3720 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3780 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3840 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3900 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3960 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4020 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4080 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4140 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4200 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4260 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4320 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4380 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4440 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4500 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4560 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4620 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4680 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4740 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4800 gatgtccctg actacgcttg a 4821 <210> 894 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> pXDP52 plasmid sequence <400> 894 atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60 ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120 ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180 ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240 acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300 aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360 accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420 ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480 gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540 tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600 cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660 ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720 acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780 ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840 ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900 agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960 cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020 atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080 aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140 gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200 ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260 acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320 tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380 gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440 cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500 tctctctttg gagaagacca gtagttacag cctacatcga ggaacagcct gtggaagtgc 1560 tgctggatac aggagctgat gacagcatcg tggccggcat tgagctggga cctaactaca 1620 ccccaaagat cgtgggcggc atcggcggat tcatcaatac caaagagtac aaggacgtga 1680 agatcaaagt gctgggcaag gtgatcaagg gcaccatcat gaccggcgac acacccatca 1740 acatcttcgg cagaaacctg ctcaccgcca tgggcatgtc tctgaacctg cctatcgcca 1800 aggtcgaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860 ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920 acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980 tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040 agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100 tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160 tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220 tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280 tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340 gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400 aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460 tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520 ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580 caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640 agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700 accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760 aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820 ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880 aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940 acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000 aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060 gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120 aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180 ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240 ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300 tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360 ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420 ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480 tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540 tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600 tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660 tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720 tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780 ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840 tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900 gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960 agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020 ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080 gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140 agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200 acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260 acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320 tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380 tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440 acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500 gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560 tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620 tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680 gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740 cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800 ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860 actacgcttg a 4871 <210> 895 <211> 4700 <212> DNA <213> Artificial Sequence <220> <223> pXDP53 plasmid sequence <400> 895 atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60 gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120 tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180 acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240 agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300 aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360 aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420 gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480 gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540 gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600 gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720 atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780 atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840 ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900 ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960 accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020 acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080 gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140 aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200 agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260 cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320 atgctgtgac agaggcccct cctaagatcg agatcaaggt gggcacaaga tggaagaaac 1380 tgctggtcga caccggcgct gataagacca tcgtgaccag ccacgacatg agcggcatcc 1440 ccaagggcag aatcatcctg cagggcattg gaggaatcat cgagggcgag aagtgggagc 1500 aggtgcacct gcagtacaag gacaagatca tccggggcac catcgtggtg ctcgccacat 1560 ctccagtgga agtgctggga agagataaca tgcgggaact gggcatcggc ctgatcatgg 1620 ctaacctgga agagaaaggt gccagggagg tgtatccaat cgtgaatggc ggcagcccaa 1680 agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc agaaggagac 1740 tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa accctgctcg 1800 tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag aagcccgaga 1860 acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg ctgaccgact 1920 acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag aaagaccccg 1980 tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag aacaagctga 2040 agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg 2100 gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag gcctacacca 2160 actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg gcccagctga 2220 aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt ggacagagag 2280 ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg aagcccctgg 2340 ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg tccgatgcct 2400 gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc gagcaccaga 2460 aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc ggcaaagaga 2520 acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa ggcgtggacg 2580 cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc 2640 tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc cctagcttcc 2700 ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc aacgtgaaga 2760 agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg gccggctaca 2820 agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag aagggcaaga 2880 agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg 2940 actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg gaaggcctga 3000 gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct aaagccgctc 3060 tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa gaggccgaca 3120 aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat ctgagaggca 3180 agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc agcaagcagt 3240 acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg tacctgatca 3300 tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag gccttcgagg 3360 ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc atggaagtga 3420 acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc aagagacagg 3480 gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg aagctggcca 3540 atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac gagcctgctc 3600 tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac atcaagccca 3660 tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc ctgacagacc 3720 ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca cacatcctga 3780 gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa gaggtggaac 3840 agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat ctggccgacg 3900 acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag gacgccatgc 3960 tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc tttatggccg 4020 agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac gagggactga 4080 gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc agcaattgcg 4140 gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag aaaaccgcca 4200 ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag atcacctact 4260 acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg gacagactga 4320 gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca ggcgaggctc 4380 tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc gtgtgcctga 4440 actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc agaagctggc 4500 tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc ggcaacaccg 4560 acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg aaagaagtct 4620 ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag tacccatatg 4680 atgtccctga ctacgcttga 4700 <210> 896 <211> 5479 <212> DNA <213> Artificial Sequence <220> <223> pXDP54 plasmid sequence <400> 896 agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60 tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180 cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240 ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300 aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360 ctgtctcatc attttggcaa agaattcgcc accatggccc tgaatgattt cgaccctatc 420 gccctccagg gctacctgcc ggcccctaga gtgctgcaac acaacgacat catcatctgc 480 agagctactt ctggcccctg gggcatcggc gacagataca acctgatcag gatccacctg 540 caagaccctg ccggacagcc ccttccaatc ccccagtggg agcctatccc taaccggacc 600 gccaaccccc ggacacagcc ctaccctgtg gtgtctgccc caatggctac cctggaaaac 660 atcctgaaca actttcacat cccccacggc gtgtccagat acggccccct ggaaggcgga 720 gattaccagc ctggcgaaca gtacagccaa ggcttctgcc ctgtgaccca ggccgagatt 780 gccctgctga acggccagca cctggaagaa gagatcacaa tcctgagaga gatcacccac 840 agactgatgc agggcgtgcg gcctcctgcc gtgcctcagg gccctgctcc tcctcctcct 900 ccagctcagc ctcctgctcc cctgcctgct ccaccaattg ggcctccacc tcccgctgcc 960 cctgcccccg ccccaggccc catgcctgtg ccccagcatc tgcctattac acatatcaga 1020 gccgtgatcg gcgaaacccc cgccaacatc cgcgaggtgc cactgtggct ggctagagcc 1080 gttcccgccc tgcagggagt gtaccccgtc caggacgccg tgatgagaag ccgcaccgtg 1140 aacgccctga ccgtgcggca ccctggactg gccctggaac ctctggagtg cggcagctgg 1200 caagagtgtc tggccgccct gtggcagaga accttcggcg ccaccgccct gcacgccctg 1260 ggcgataccc tgggtcagat cgcaaacagc gacggcatcg tgatggctat cgagctgggc 1320 ctgctctttt ccgatgataa ctgggacctg gtgtggggaa tctgtagaag attcctgccc 1380 ggccaggccg tctgcgtggc cgtgcaggcc agactggatc ccctgcccga caacgctaca 1440 agaatcgtga tgatcagcca catcatccgg gacgtgtacg ccatcctggg cctggaccct 1500 ctgggcagac ccatgcagca gacactgcct agacggaaca accagcctcc cagacagcag 1560 ccacagagac ggcagcagcc tagaagaacc ggcaaccagg aggaaagagg ccagcggaac 1620 cggggccggc agaacgccca gacccctcgg caggagggca acagactgca gaacagccag 1680 ctgcctggcc ctcgcgactg ccccaacaat agcaaccagc ctcggtaccc tctgcggcca 1740 aacccccagc agccccaaag atacggccag gagcagaatc gtggcaacaa tcccaaccct 1800 tacagacaac ctacccctgg caatggaaat caaaacagaa acttcagccg ggggcctgcc 1860 ccagtcaatg agcagagcag aggcagagga agatctagcc agggtacaaa taacaccggc 1920 tcctctgctg tgcacagcgt gcggctgacc agcgccgccc ctcctatacc cccacaagat 1980 gccggcactc cgcccacttc aagtggaaat caagggcaat catcttaaag gctactggga 2040 cagcggcgcc gagatcacat gcgtgcccgc tatctacatc atcgaggaac aacctgttgg 2100 caagaagctg attacaacca tccacaacga gaaggaacat gatgtgtact acgtggaaat 2160 gaaaatcgag aagcggaagg tgcagtgtga agtgatcgcc accgccctgg attacgtgct 2220 ggtggcccct gtggacatcc cctggtataa gcctggacct ctggaactga ccatcaagat 2280 cgacgtcgag agccagaagc acaccctgat cacagagtcc accctctctc cacagggcca 2340 gatgagactg aagaaactgc tggaccagta ccaggccctg tggcagtgct gggagaacca 2400 ggtgggccac agaagaggtg cctctgctgt gcacagcgtg cggctgggcg gcagcccaaa 2460 gaagaagcgg aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact 2520 ggtcaaggac agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt 2580 cagagtgatg acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa 2640 catccctcag cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta 2700 caccgagatg aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt 2760 gggcctgatg agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa 2820 gcccgagatg gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg 2880 ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa 2940 ctacttcggc agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa 3000 acctgagaag gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc 3060 cctggacttc tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc 3120 tcagatcgcc ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg 3180 catgggaaca atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa 3240 ggtggtcaag ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa 3300 cctggaatac cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc 3360 ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct 3420 gaaactgtcc agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc 3480 tctggtggaa agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa 3540 gctgatcaac gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa 3600 gagacaagaa gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa 3660 gttcgccaga taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga 3720 ctggggcaaa gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag 3780 caagcacatt aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct 3840 gaccgattgg ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa 3900 ggacgagttc tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa 3960 gcccttcgcc attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta 4020 caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat 4080 caattacttc aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc 4140 taacagattc tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa 4200 cttcaacttc gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg 4260 cagagagttc atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa 4320 tggcagagtg atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct 4380 gtttgtggcc ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat 4440 gaacctgatc ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc 4500 tgaaggatgc ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag 4560 aatcggcgag agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca 4620 gagaagagcc ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga 4680 catggtccga aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct 4740 gatcttcgag aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga 4800 gaggcagtac accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag 4860 caagacctac ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg 4920 cttcaccatc accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac 4980 cggctggatg accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta 5040 caacaggtac aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag 5100 cgaagagagc gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct 5160 gagcctgctg aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa 5220 ctgcggcttc gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct 5280 gttcctgaga agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga 5340 caagagggcc tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg 5400 gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga 5460 tgtccctgac tacgcttga 5479 <210> 897 <211> 5764 <212> DNA <213> Artificial Sequence <220> <223> pXDP55 plasmid sequence <400> 897 agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60 tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180 cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240 ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300 aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360 ctgtctcatc attttggcaa agaattcgcc accatgagcc agccctccgc ttctggcagc 420 gccggcgccg gaggcgcccc tcagcaacct cctcctccac ctccccagcc cggacctgcc 480 gcccccgtgc ctagagccca gatcggttat ggagatctgg acgtgcttct gctgcaacag 540 gagtaccacc tcatcgatcc taatctgcaa gtgcaacacc tggacaccct gctggtgaga 600 atcacaggcg gaaactgggg ccctggcgat agattcgcca gaatcgaggt gctgctccgc 660 gacacactgg gccctctgca acagcctaga tacagatacg ccgccatgca gcaggccgac 720 ctgagaaacg acatcatcct gcacctgaac taccaggatg ccatcatcat cttcgacatg 780 atcatcccca gcgagggcgt gcaccggcac ggccctatgt ttgacggcct gtggatccac 840 ggcgacgact acagcatgaa cttccagcct atcacagccc acgagctgta cctgctgcct 900 cagcaggtgc tgaccgagga agtggaactg ctcaccgagg tgtgcaacag aatggccgat 960 tggatccggc ggcacaggtg tggcggagga agcggctcct ctcagccacc tcctccccca 1020 cctccagccg tgccagtgct gcctagtgcc cctccagcca gcagcctgcc cctgccccca 1080 cagggctggg gcatctctcc tcccgtggct accagcaccc ctggcgctgc cggacattct 1140 agcagcgccg gtcctaacat cagcctgggc ggcacctacg tgccccctcc tgtggctcct 1200 ccagcccctg tgatcggcgg ccctggcgga cccggacagc tgcctgctat ggtgcaggtg 1260 ctgcccgctc aacctgtcgt gatccccatt aacgtgatca gatctgtgtg cggcgataca 1320 cctagcaacc ctcaagacat ccctctgtgg atgggcagaa tcatccccgc cattgagggc 1380 gtctttccta ttgacaaccc caatctgaga atgagagtgg tgaacgccct gctggctctg 1440 catcctggcc tggctatcac cgaactgaat gcccagacat ggggccaggt tctggctgtg 1500 ctgcacatgc gggccctggg acacaccgcc ctgcaccagc tgcctgccct gctggaaaca 1560 atcgtgaaga ccgacggcat cctgccagct tataacatgg gcatggaagt tacacagcag 1620 gatttcagct acgtgtgggg catcctgcgg acactgttgc ccggccaagc cttcgtgctg 1680 agcatgcaga acgagctgga ccggctgcct gccgcccaga gacctggaat gttccccggc 1740 ctgctgcaga gaaccctgga tatcctgggc ctgaacagca gaggacagaa catccagaaa 1800 accaacaccc agcagcaggc cccaaagcgg ggccagaagc ctaagcccag actgccccca 1860 gtgcacagac ggcctgcacc cttcacccct cctgccaccc ccagccctcg gcagcaggcc 1920 agcgccagcc ccagcagcca gggcgacaac agaagccctc agcctcaggg cagaggcaca 1980 tacggcccga gccggggagg cggctctggc cctagataca acttccgtcc cagagtgcag 2040 cctcccgaca gatacggctt cggcagaggc cagggaggca gaagcagcat cggcgcccag 2100 gacaatcagc agcccggaca aggcggacag cggacccagc agaccaacca gaaccgcaac 2160 cagggcaacg ccaccggcgg tagaacccag cctcagaata gaacagtgaa caccgtgcgg 2220 gtgacccaga ccaatcctca aggcggctcc tccgtgtcca acccagctgt gacaacttct 2280 cagaatacag gaacaggaag tgcaactcag agctcatcat cttaaaggct ttgtggacac 2340 aggcagcagc atcacctgct tccccaagta caccctggtc gaggaagatc ctatcggcca 2400 gtacgacatc agcaccatcc acggcacagt gtcccagcct gtgtactaca tcaagttcaa 2460 ggtgaacggc aagaaagtgg aagccgaggt gaccgagtct ccactggact acgtgatcct 2520 gtgtcctagc gacgtgccct ggctgtctac aaagctggaa ctgacaatta agctgcctct 2580 gcaccagcag caacaggagc tgctgagcaa gaccagagtg aatcaaaaac agctgcagaa 2640 actctttatc cagtatgatg acctgtggca gaagtgggag aaccaggttg gacaccggaa 2700 gggtgccaga acagtgaaca ccgtgcgggt gggcggcagc ccaaagaaga agcggaaggt 2760 ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2820 cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2880 tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2940 cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 3000 agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 3060 agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 3120 gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 3180 gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 3240 taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 3300 tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3360 catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3420 tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3480 cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3540 ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3600 cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3660 cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3720 cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3780 ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3840 gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3900 gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3960 gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 4020 cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 4080 ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 4140 agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 4200 atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 4260 ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 4320 ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4380 cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4440 cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4500 ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4560 gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4620 gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4680 cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4740 ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4800 gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4860 caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4920 atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4980 cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 5040 gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 5100 aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 5160 caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 5220 cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 5280 catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 5340 gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5400 caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5460 gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5520 acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5580 agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5640 ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5700 tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5760 ttga 5764 <210> 898 <211> 5404 <212> DNA <213> Artificial Sequence <220> <223> pXDP56 plasmid Sequence <400> 898 atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60 ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120 accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180 gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240 cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300 gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360 gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420 gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480 ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540 atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600 agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660 cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720 tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780 gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840 gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900 gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960 ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020 gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080 ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140 cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200 caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260 ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320 cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380 aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440 acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500 cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560 ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620 ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680 accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740 gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800 ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860 aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920 gcttccagcg gagatcaaag gaactaaact gttagcccat tgggacagcg gcgccaccat 1980 tacatgcgtg cccgagtcct tcctggaaga tgagcagcct atcaaacaga ccctgatcaa 2040 gacaatccac ggcgagaagc agcagaaagt gtactacctg acctttaaga tcaagggaag 2100 aaaggtggaa gctgaagtga tcgccagccc ttacgagtac atcctgctgt ctccaacaga 2160 cgtgccttgg ctgacacagc aacctctgca gctgaccatc ctggtccccc tgcaggagta 2220 tcaggataga atcctcaaca agaccgccct gcctgaggaa cagaagcaaa gactgaagac 2280 cctgttcgcc aagtacgaca ccctgtggca gcactgggag aaccaggtgg gccaccggcg 2340 gggtgccaga gccgtcaaca cagtgaccca gggcggcagc ccaaagaaga agcggaaggt 2400 ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2460 cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2520 tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2580 cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 2640 agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 2700 agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 2760 gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 2820 gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 2880 taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 2940 tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3000 catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3060 tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3120 cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3180 ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3240 cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3300 cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3360 cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3420 ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3480 gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3540 gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3600 gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 3660 cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 3720 ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 3780 agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 3840 atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 3900 ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 3960 ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4020 cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4080 cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4140 ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4200 gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4260 gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4320 cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4380 ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4440 gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4500 caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4560 atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4620 cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 4680 gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 4740 aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 4800 caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 4860 cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 4920 catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 4980 gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5040 caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5100 gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5160 acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5220 agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5280 ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5340 tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5400 ttga 5404 <210> 899 <211> 5140 <212> DNA <213> Artificial Sequence <220> <223> pXDP57 plasmid sequence <400> 899 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680 gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740 agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800 ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860 ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920 gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980 tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040 gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100 ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160 caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220 ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280 cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340 gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400 agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460 gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520 ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580 gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640 gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700 gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760 acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820 caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880 catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940 ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000 cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060 cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120 gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180 catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240 gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300 ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360 ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420 caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480 cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540 gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600 gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660 cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720 actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780 caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840 gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900 ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960 cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020 cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080 cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140 tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200 caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260 ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320 ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380 cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440 caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500 actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560 caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620 aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680 tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740 cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800 gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860 agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920 gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980 caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040 aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100 agccctcgag tacccatatg atgtccctga ctacgcttga 5140 <210> 900 <211> 4996 <212> DNA <213> Artificial Sequence <220> <223> pXDP58 plasmid sequence <400> 900 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500 tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560 tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620 gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680 gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740 cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800 tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860 agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920 gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980 gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040 caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100 agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160 ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220 cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280 cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340 cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400 gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460 cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520 tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580 ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640 gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700 gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760 ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820 ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880 caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940 actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000 ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060 gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120 acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180 cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240 gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300 gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360 cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420 cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480 cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540 ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600 ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660 cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720 caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780 agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840 cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900 tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960 cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020 aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080 cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140 aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200 ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260 cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320 gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380 gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440 caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500 ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560 caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620 agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680 cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740 cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800 cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860 gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920 gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980 ccctgactac gcttga 4996 <210> 901 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP59 plasmid sequence <400> 901 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980 atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040 catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160 gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220 ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280 gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340 tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 902 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP60 plasmid sequence <400> 902 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980 ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040 catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160 gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220 ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280 gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340 tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 903 <211> 5811 <212> DNA <213> Artificial Sequence <220> <223> pXDP61 plasmid sequence <400> 903 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660 ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720 ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780 cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840 aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900 gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960 gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020 ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080 gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140 tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200 acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260 gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320 ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380 agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440 aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500 aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560 caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620 aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680 aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740 tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800 ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860 cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920 aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980 gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040 cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100 tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160 tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220 acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280 tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340 aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400 tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460 ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520 tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580 gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640 aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700 taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760 gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811 <210> 904 <211> 5077 <212> DNA <213> Artificial Sequence <220> <223> pXDP62 plasmid sequence <400> 904 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420 aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480 gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540 actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600 catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660 aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720 cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780 ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840 ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900 tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960 actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020 accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080 gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140 cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320 ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380 taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440 atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500 aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560 ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620 ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680 tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740 tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800 acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860 ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920 attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980 cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040 gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100 caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160 catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220 gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280 caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340 gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400 cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460 tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520 aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580 tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640 caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700 ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760 agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820 catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880 gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940 aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000 gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060 gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120 ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180 gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240 ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300 aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360 gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420 ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480 cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540 cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600 cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660 gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720 acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780 cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840 cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900 ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960 acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020 cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080 gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140 ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200 caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260 caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320 gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380 gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440 ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500 gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560 gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620 gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680 ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740 cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800 gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860 cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920 gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980 aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040 cctcgagtac ccatatgatg tccctgacta cgcttga 5077 <210> 905 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> pXDP63 plasmid sequence <400> 905 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420 ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480 gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540 tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600 caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660 ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720 actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780 ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840 ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900 agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960 caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020 atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080 aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140 gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200 ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260 acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320 tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380 gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440 cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500 tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560 tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620 cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680 aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740 atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800 aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860 ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920 acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980 tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040 agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100 tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160 tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220 tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280 tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340 gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400 aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460 tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520 ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580 caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640 agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700 accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760 aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820 ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880 aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940 acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000 aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060 gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120 aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180 ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240 ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300 tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360 ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420 ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480 tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540 tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600 tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660 tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720 tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780 ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840 tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900 gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960 agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020 ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080 gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140 agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200 acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260 acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320 tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380 tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440 acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500 gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560 tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620 tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680 gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740 cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800 ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860 actacgcttg a 4871 <210> 906 <211> 4805 <212> DNA <213> Artificial Sequence <220> <223> pXDP88 plasmid sequence <400> 906 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800 aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860 gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920 cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980 ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040 agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100 gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160 acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220 tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280 gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340 actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400 acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460 gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520 tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580 gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640 ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700 tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760 gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820 gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880 agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940 ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000 accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060 tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120 agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180 tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240 gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300 ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360 tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420 aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480 acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540 acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600 tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660 tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720 tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780 gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840 cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900 gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960 gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020 acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080 atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140 ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200 tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260 ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320 ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380 agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440 tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500 agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560 agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620 gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680 ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740 tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800 acgct 4805 <210> 907 <211> 2413 <212> DNA <213> Artificial Sequence <220> <223> pStx42.174.12.7 plasmid sequence <400> 907 gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60 tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360 aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660 ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020 caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800 ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860 gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040 tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100 gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280 acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340 gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400 tttttttgaa ttc 2413 <210> 908 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 908 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 909 <211> 4530 <212> DNA <213> Artificial Sequence <220> <223> pXDP64 plasmid sequence <400> 909 atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60 ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120 agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180 agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240 ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300 ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360 cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420 ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480 atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540 tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660 gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720 gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780 ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840 gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960 gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020 aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080 gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140 gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200 gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260 cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320 cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380 gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440 agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggc 1500 ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 1560 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 1620 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 1680 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 1740 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 1800 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 1860 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 1920 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 1980 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2040 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2100 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2160 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2220 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2280 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2340 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2400 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2460 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 2520 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 2580 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 2640 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 2700 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 2760 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 2820 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 2880 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 2940 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3000 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3060 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3120 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3180 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3240 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3300 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3360 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3420 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3480 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 3540 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 3600 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 3660 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 3720 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 3780 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 3840 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 3900 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 3960 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4020 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4080 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4140 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4200 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4260 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4320 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4380 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4440 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4500 tacccatatg atgtccctga ctacgcttga 4530 <210> 910 <211> 4527 <212> DNA <213> Artificial Sequence <220> <223> pXDP65 plasmid sequence <400> 910 atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60 ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120 agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180 cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240 ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300 ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360 agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420 cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480 attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540 tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660 gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720 gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780 ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840 gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960 gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020 aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080 gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140 gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200 gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260 cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320 caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380 gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440 tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagggcggc 1500 agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1560 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1620 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1680 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1740 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1800 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1860 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1920 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1980 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2040 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2100 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2160 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2220 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2280 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2340 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2400 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2460 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2520 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2580 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2640 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2700 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2760 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2820 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2880 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2940 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3000 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3060 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3120 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3180 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3240 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3300 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3360 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3420 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3480 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3540 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3600 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3660 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3720 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3780 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3840 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3900 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3960 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4020 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4080 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4140 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4200 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4260 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4320 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4380 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4440 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4500 ccatatgatg tccctgacta cgcttga 4527 <210> 911 <211> 4497 <212> DNA <213> Artificial Sequence <220> <223> pXDP66 plasmid sequence <400> 911 atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60 agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120 tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180 cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240 ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300 aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360 gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420 ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480 tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540 ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600 aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660 gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720 agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780 gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840 atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900 ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960 ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020 aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080 gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140 agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200 cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260 aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320 gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380 tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440 gctctgcagg gcaaaagcat caagggcggc agcccaaaga agaagcggaa ggtctctaga 1500 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1560 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1620 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1680 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1740 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1800 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 1860 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 1920 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 1980 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2040 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2100 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2160 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2220 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2280 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2340 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2400 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2460 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2520 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2580 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2640 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2700 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2760 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 2820 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 2880 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 2940 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3000 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3060 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3120 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3180 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3240 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3300 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3360 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3420 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3480 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3540 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3600 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3660 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3720 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3780 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 3840 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 3900 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 3960 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4020 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4080 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4140 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4200 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4260 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4320 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4380 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4440 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4497 <210> 912 <211> 4551 <212> DNA <213> Artificial Sequence <220> <223> pXDP67 plasmid sequence <400> 912 atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60 tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120 aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180 ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240 tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300 agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360 agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420 accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480 gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540 gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600 aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660 cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720 gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780 gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840 gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900 cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960 tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020 gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080 aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140 tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200 gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260 ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320 atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380 tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440 agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500 agaggacaaa agtacagcgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 1560 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 1620 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 1680 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 1740 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 1800 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 1860 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 1920 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 1980 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 2040 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 2100 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 2160 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 2220 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 2280 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 2340 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 2400 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 2460 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 2520 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 2580 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 2640 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 2700 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 2760 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 2820 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 2880 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 2940 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 3000 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 3060 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 3120 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 3180 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 3240 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 3300 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 3360 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 3420 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 3480 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 3540 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 3600 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 3660 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 3720 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 3780 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 3840 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 3900 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 3960 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 4020 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 4080 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 4140 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 4200 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 4260 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 4320 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 4380 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 4440 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 4500 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 4551 <210> 913 <211> 4638 <212> DNA <213> Artificial Sequence <220> <223> pXDP68 plasmid sequence <400> 913 atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60 acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120 acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180 gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240 agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300 gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360 accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420 tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480 ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540 gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600 agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660 cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720 ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780 caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840 aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900 gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960 gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020 ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080 gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140 tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200 accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260 gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320 ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380 agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440 aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500 aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560 cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaagggcgg cagcccaaag 1620 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1680 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1740 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1800 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1860 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1920 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1980 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2040 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2100 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2160 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2220 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2280 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2340 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2400 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2460 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2520 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2580 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2640 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2700 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2760 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2820 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2880 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2940 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3000 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3060 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3120 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3180 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3240 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3300 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3360 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3420 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3480 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3540 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3600 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3660 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3720 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3780 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3840 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3900 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3960 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4020 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4080 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4140 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4200 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4260 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4320 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4380 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4440 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4500 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4560 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4620 gtccctgact acgcttga 4638 <210> 914 <211> 4029 <212> DNA <213> Artificial Sequence <220> <223> pXDP69 plasmid sequence <400> 914 atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60 ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120 aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180 ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240 aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300 ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360 agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420 ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480 gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540 acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600 cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660 cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720 ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780 cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840 ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900 aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960 gccctgctgg tgcacacccc aggaccaaag atgcctggcg gcagcccaaa gaagaagcgg 1020 aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1080 agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1140 acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1200 cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1260 aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1320 agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1380 gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1440 ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 1500 agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 1560 gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 1620 tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 1680 ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 1740 atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 1800 ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 1860 cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 1920 gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 1980 agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2040 agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2100 gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2160 gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2220 taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2280 gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2340 aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2400 ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 2460 tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 2520 attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 2580 ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 2640 aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 2700 tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 2760 gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 2820 atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 2880 atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 2940 ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3000 ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3060 ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3120 agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3180 ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3240 aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3300 aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3360 accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3420 ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 3480 accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 3540 accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 3600 aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 3660 gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 3720 aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 3780 gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 3840 agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 3900 tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 3960 gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4020 tacgcttga 4029 <210> 915 <211> 4095 <212> DNA <213> Artificial Sequence <220> <223> pXDP70 plasmid sequence <400> 915 atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60 gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120 tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180 tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240 aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300 cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360 tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420 aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480 gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540 acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600 caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660 aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720 agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780 ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840 ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900 tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960 accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020 accaaggtgc tggtggtgca gcctaagaag cctcccccta atggcggcag cccaaagaag 1080 aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 1140 aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 1200 gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 1260 cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 1320 gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 1380 ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 1440 gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 1500 cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 1560 ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 1620 gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 1680 gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 1740 atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 1800 ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 1860 gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 1920 gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 1980 aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2040 ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 2100 gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 2160 atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 2220 caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 2280 gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 2340 ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 2400 cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 2460 gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 2520 gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 2580 ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 2640 tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 2700 tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 2760 agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 2820 aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 2880 gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 2940 agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3000 gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3060 ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 3120 ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 3180 ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 3240 agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 3300 gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 3360 ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 3420 cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 3480 acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 3540 accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 3600 tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 3660 aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 3720 gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 3780 ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 3840 ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 3900 ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 3960 agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4020 cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4080 cctgactacg cttga 4095 <210> 916 <211> 4434 <212> DNA <213> Artificial Sequence <220> <223> pXDP71 plasmid sequence <400> 916 atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60 accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120 aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180 gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240 cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300 aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360 acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420 aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480 ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540 aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600 gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660 aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720 aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780 ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840 aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900 atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960 acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020 aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080 accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140 gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200 aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260 gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320 cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380 gcccagacaa tgaacggcaa tggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1440 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1500 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1560 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1620 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 1680 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 1740 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 1800 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 1860 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 1920 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 1980 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2040 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2100 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2160 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2220 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2280 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2340 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2400 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2460 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2520 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2580 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 2640 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 2700 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 2760 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 2820 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 2880 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 2940 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3000 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3060 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3120 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3180 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3240 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3300 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3360 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3420 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3480 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3540 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3600 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 3660 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 3720 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 3780 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 3840 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 3900 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 3960 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4020 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4080 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4140 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4200 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4260 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4320 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4380 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4434 <210> 917 <211> 4398 <212> DNA <213> Artificial Sequence <220> <223> pXDP72 plasmid sequence <400> 917 atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60 gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120 gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180 atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240 ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300 ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360 cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420 ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480 cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540 tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600 gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660 aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720 atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780 accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840 ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900 tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960 gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020 cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080 tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140 taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200 acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260 gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320 atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaaggcgg cagcccaaag 1380 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380 gtccctgact acgcttga 4398 <210> 918 <211> 4497 <212> DNA <213> Artificial Sequence <220> <223> pXDP73 plasmid sequence <400> 918 atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60 cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120 gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180 atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240 ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300 gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360 cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420 aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480 gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540 gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600 aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660 ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720 aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780 atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840 gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900 cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960 tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020 ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080 cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140 ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200 tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260 ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320 gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380 cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440 gtggtgtccg gacagaagca ggacggcggc agcccaaaga agaagcggaa ggtctctaga 1500 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1560 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1620 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1680 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1740 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1800 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 1860 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 1920 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 1980 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2040 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2100 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2160 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2220 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2280 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2340 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2400 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2460 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2520 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2580 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2640 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2700 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2760 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 2820 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 2880 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 2940 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3000 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3060 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3120 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3180 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3240 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3300 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3360 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3420 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3480 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3540 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3600 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3660 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3720 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3780 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 3840 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 3900 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 3960 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4020 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4080 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4140 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4200 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4260 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4320 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4380 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4440 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4497 <210> 919 <211> 4158 <212> DNA <213> Artificial Sequence <220> <223> pXDP74 plasmid sequence <400> 919 atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60 gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120 ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180 aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240 acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300 atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360 atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420 agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480 gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540 gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600 gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720 cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780 agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840 aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900 gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960 aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020 ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080 ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggggcgg cagcccaaag 1140 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140 gtccctgact acgcttga 4158 <210> 920 <211> 4140 <212> DNA <213> Artificial Sequence <220> <223> pXDP75 plasmid sequence <400> 920 atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60 ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120 cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180 gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240 gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300 tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360 agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420 cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480 tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540 ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600 atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660 cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720 cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780 atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840 gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900 caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960 gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020 gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080 acaggcctgg ccggaccatt caagggaggc ggcagcccaa agaagaagcg gaaggtctct 1140 agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1200 aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1260 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1320 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1380 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1440 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1500 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1560 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 1620 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 1680 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 1740 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 1800 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 1860 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 1920 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 1980 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2040 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2100 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2160 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2220 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2280 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2340 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2400 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2460 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2520 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 2580 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 2640 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 2700 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 2760 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 2820 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 2880 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 2940 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3000 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3060 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3120 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3180 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3240 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3300 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3360 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3420 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3480 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3540 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 3600 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 3660 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 3720 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 3780 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 3840 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 3900 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 3960 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4020 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4080 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttga 4140 <210> 921 <211> 4158 <212> DNA <213> Artificial Sequence <220> <223> pXDP76 plasmid sequence <400> 921 atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60 ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120 ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180 ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240 acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300 aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360 accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420 ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480 gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540 tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600 cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660 ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720 acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780 ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840 ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900 agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960 cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020 atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080 aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctggcgg cagcccaaag 1140 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140 gtccctgact acgcttga 4158 <210> 922 <211> 4152 <212> DNA <213> Artificial Sequence <220> <223> pXDP77 plasmid sequence <400> 922 atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60 gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120 tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180 acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240 agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300 aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360 aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420 gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480 gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540 gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600 gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720 atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780 atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840 ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900 ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960 accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020 acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080 gagggcttta agatgcagct gctggcccag gccctgagag gcggcagccc aaagaagaag 1140 cggaaggtct ctagacaaga gatcaagaga atcaacaaga tcagaaggag actggtcaag 1200 gacagcaaca caaagaaggc cggcaagaca ggccccatga aaaccctgct cgtcagagtg 1260 atgacccctg acctgagaga gcggctggaa aacctgagaa agaagcccga gaacatccct 1320 cagcctatca gcaacaccag cagggccaac ctgaacaagc tgctgaccga ctacaccgag 1380 atgaagaaag ccatcctgca cgtgtactgg gaagagttcc agaaagaccc cgtgggcctg 1440 atgagcagag ttgctcagcc tgccagcaag aagatcgacc agaacaagct gaagcccgag 1500 atggacgaga agggcaatct gaccacagcc ggctttgcct gctctcagtg tggccagcct 1560 ctgttcgtgt acaagctgga acaggtgtcc gagaaaggca aggcctacac caactacttc 1620 ggcagatgta acgtggccga gcacgagaag ctgattctgc tggcccagct gaaacctgag 1680 aaggactctg atgaggccgt gacctacagc ctgggcaagt ttggacagag agccctggac 1740 ttctacagca tccacgtgac caaagaaagc acacaccccg tgaagcccct ggctcagatc 1800 gccggcaata gatacgcctc tggacctgtg ggcaaagccc tgtccgatgc ctgcatggga 1860 acaatcgcca gcttcctgag caagtaccag gacatcatca tcgagcacca gaaggtggtc 1920 aagggcaacc agaagagact ggaaagcctg agggagctgg ccggcaaaga gaacctggaa 1980 taccccagcg tgaccctgcc tcctcagcct cacacaaaag aaggcgtgga cgcctacaac 2040 gaagtgatcg ccagagtgag aatgtgggtc aacctgaacc tgtggcagaa gctgaaactg 2100 tccagggacg acgccaagcc tctgctgaga ctgaagggct tccctagctt ccctctggtg 2160 gaaagacagg ccaatgaagt ggattggtgg gacatggtct gcaacgtgaa gaagctgatc 2220 aacgagaaga aagaggatgg caaggttttc tggcagaacc tggccggcta caagagacaa 2280 gaagccctga ggccttacct gagcagcgaa gaggaccgga agaagggcaa gaagttcgcc 2340 agataccagc tgggcgacct gctgctgcac ctggaaaaga agcacggcga ggactggggc 2400 aaagtgtacg atgaggcctg ggagagaatc gacaagaagg tggaaggcct gagcaagcac 2460 attaagctgg aagaggaaag aaggagcgag gacgcccaat ctaaagccgc tctgaccgat 2520 tggctgagag ccaaggccag ctttgtgatc gagggcctga aagaggccga caaggacgag 2580 ttctgcagat gcgagctgaa gctgcagaag tggtacggcg atctgagagg caagcccttc 2640 gccattgagg ccgagaacag catcctggac atcagcggct tcagcaagca gtacaactgc 2700 gccttcattt ggcagaaaga cggcgtcaag aaactgaacc tgtacctgat catcaattac 2760 ttcaaaggcg gcaagctgcg gttcaagaag atcaaacccg aggccttcga ggctaacaga 2820 ttctacaccg tgatcaacaa aaagtccggc gagatcgtgc ccatggaagt gaacttcaac 2880 ttcgacgacc ccaacctgat tatcctgcct ctggccttcg gcaagagaca gggcagagag 2940 ttcatctgga acgatctgct gagcctggaa accggctctc tgaagctggc caatggcaga 3000 gtgatcgaga aaaccctgta caacaggaga accagacagg acgagcctgc tctgtttgtg 3060 gccctgacct tcgagagaag agaggtgctg gacagcagca acatcaagcc catgaacctg 3120 atcggcgtgg accggggcga gaatatccct gctgtgatcg ccctgacaga ccctgaagga 3180 tgcccactga gcagattcaa ggactccctg ggcaacccta cacacatcct gagaatcggc 3240 gagagctaca aagagaagca gaggacaatc caggccaaga aagaggtgga acagagaaga 3300 gccggcggat actctaggaa gtacgccagc aaggccaaga atctggccga cgacatggtc 3360 cgaaacaccg ccagagatct gctgtactac gccgtgacac aggacgccat gctgatcttc 3420 gagaatctga gcagaggctt cggccggcag ggcaagagaa cctttatggc cgagaggcag 3480 tacaccagaa tggaagattg gctcacagct aaactggcct acgagggact gagcaagacc 3540 tacctgtcca aaacactggc ccagtatacc tccaagacct gcagcaattg cggcttcacc 3600 atcaccagcg ccgactacga cagagtgctg gaaaagctca agaaaaccgc caccggctgg 3660 atgaccacca tcaacggcaa agagctgaag gttgagggcc agatcaccta ctacaacagg 3720 tacaagaggc agaacgtcgt gaaggatctg agcgtggaac tggacagact gagcgaagag 3780 agcgtgaaca acgacatcag cagctggaca aagggcagat caggcgaggc tctgagcctg 3840 ctgaagaaga ggtttagcca cagacctgtg caagagaagt tcgtgtgcct gaactgcggc 3900 ttcgagacac acgccgatga acaggctgcc ctgaacattg ccagaagctg gctgttcctg 3960 agaagccaag agtacaagaa gtaccagacc aacaagacca ccggcaacac cgacaagagg 4020 gcctttgtgg aaacctggca gagcttctac agaaaaaagc tgaaagaagt ctggaagccc 4080 gccgtgacta gtccaaaaaa gaagagaaag gtagccctcg agtacccata tgatgtccct 4140 gactacgctt ga 4152 <210> 923 <211> 4638 <212> DNA <213> Artificial Sequence <220> <223> pXDP85 plasmid sequence <400> 923 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660 ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720 ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780 cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840 aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900 gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960 gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020 ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080 gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140 tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200 acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260 gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320 ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380 agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440 aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500 aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560 caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaaggcgg cagcccaaag 1620 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1680 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1740 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1800 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1860 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1920 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1980 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2040 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2100 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2160 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2220 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2280 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2340 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2400 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2460 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2520 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2580 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2640 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2700 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2760 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2820 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2880 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2940 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3000 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3060 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3120 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3180 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3240 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3300 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3360 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3420 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3480 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3540 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3600 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3660 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3720 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3780 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3840 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3900 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3960 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4020 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4080 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4140 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4200 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4260 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4320 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4380 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4440 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4500 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4560 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4620 gtccctgact acgcttga 4638 <210> 924 <211> 4095 <212> DNA <213> Artificial Sequence <220> <223> pXDP86 plasmid sequence <400> 924 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420 aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480 gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540 actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600 catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660 aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720 cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780 ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840 ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900 tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960 actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020 accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atggcggcag cccaaagaag 1080 aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 1140 aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 1200 gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 1260 cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 1320 gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 1380 ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 1440 gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 1500 cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 1560 ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 1620 gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 1680 gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 1740 atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 1800 ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 1860 gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 1920 gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 1980 aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2040 ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 2100 gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 2160 atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 2220 caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 2280 gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 2340 ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 2400 cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 2460 gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 2520 gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 2580 ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 2640 tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 2700 tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 2760 agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 2820 aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 2880 gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 2940 agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3000 gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3060 ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 3120 ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 3180 ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 3240 agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 3300 gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 3360 ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 3420 cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 3480 acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 3540 accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 3600 tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 3660 aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 3720 gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 3780 ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 3840 ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 3900 ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 3960 agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4020 cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4080 cctgactacg cttga 4095 <210> 925 <211> 4158 <212> DNA <213> Artificial Sequence <220> <223> pXDP87 plasmid sequence <400> 925 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420 ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480 gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540 tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600 caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660 ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720 actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780 ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840 ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900 agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960 caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020 atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080 aaagctaggt taatggcaga agcattgaaa gaggcactga ggccaggcgg cagcccaaag 1140 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140 gtccctgact acgcttga 4158 <210> 926 <211> 5140 <212> DNA <213> Artificial Sequence <220> <223> pXDP57 plasmid sequence <400> 926 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680 gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740 agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800 ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860 ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920 gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980 tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040 gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100 ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160 caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220 ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280 cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340 gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400 agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460 gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520 ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580 gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640 gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700 gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760 acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820 caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880 catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940 ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000 cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060 cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120 gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180 catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240 gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300 ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360 ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420 caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480 cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540 gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600 gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660 cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720 actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780 caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840 gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900 ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960 cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020 cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080 cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140 tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200 caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260 ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320 ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380 cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440 caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500 actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560 caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620 aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680 tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740 cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800 gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860 agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920 gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980 caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040 aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100 agccctcgag tacccatatg atgtccctga ctacgcttga 5140 <210> 927 <211> 4996 <212> DNA <213> Artificial Sequence <220> <223> pXDP58 plasmid sequence <400> 927 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500 tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560 tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620 gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680 gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740 cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800 tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860 agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920 gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980 gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040 caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100 agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160 ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220 cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280 cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340 cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400 gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460 cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520 tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580 ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640 gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700 gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760 ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820 ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880 caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940 actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000 ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060 gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120 acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180 cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240 gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300 gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360 cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420 cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480 cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540 ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600 ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660 cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720 caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780 agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840 cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900 tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960 cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020 aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080 cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140 aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200 ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260 cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320 gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380 gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440 caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500 ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560 caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620 agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680 cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740 cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800 cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860 gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920 gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980 ccctgactac gcttga 4996 <210> 928 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP59 plasmid sequence <400> 928 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980 atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040 catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160 gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220 ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280 gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340 tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 929 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP60 plasmid sequence <400> 929 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980 ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040 catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160 gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220 ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280 gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340 tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 930 <211> 5811 <212> DNA <213> Artificial Sequence <220> <223> pXDP61 plasmid sequence <400> 930 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660 ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720 ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780 cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840 aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900 gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960 gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020 ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080 gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140 tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200 acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260 gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320 ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380 agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440 aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500 aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560 caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620 aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680 aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740 tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800 ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860 cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920 aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980 gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040 cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100 tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160 tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220 acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280 tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340 aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400 tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460 ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520 tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580 gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640 aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700 taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760 gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811 <210> 931 <211> 5077 <212> DNA <213> Artificial Sequence <220> <223> pXDP62 plasmid sequence <400> 931 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420 aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480 gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540 actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600 catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660 aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720 cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780 ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840 ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900 tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960 actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020 accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080 gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140 cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320 ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380 taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440 atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500 aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560 ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620 ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680 tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740 tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800 acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860 ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920 attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980 cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040 gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100 caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160 catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220 gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280 caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340 gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400 cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460 tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520 aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580 tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640 caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700 ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760 agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820 catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880 gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940 aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000 gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060 gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120 ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180 gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240 ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300 aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360 gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420 ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480 cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540 cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600 cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660 gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720 acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780 cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840 cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900 ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960 acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020 cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080 gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140 ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200 caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260 caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320 gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380 gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440 ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500 gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560 gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620 gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680 ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740 cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800 gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860 cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920 gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980 aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040 cctcgagtac ccatatgatg tccctgacta cgcttga 5077 <210> 932 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> pXDP63 plasmid sequence <400> 932 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420 ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480 gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540 tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600 caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660 ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720 actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780 ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840 ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900 agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960 caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020 atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080 aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140 gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200 ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260 acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320 tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380 gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440 cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500 tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560 tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620 cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680 aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740 atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800 aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860 ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920 acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980 tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040 agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100 tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160 tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220 tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280 tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340 gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400 aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460 tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520 ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580 caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640 agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700 accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760 aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820 ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880 aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940 acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000 aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060 gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120 aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180 ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240 ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300 tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360 ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420 ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480 tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540 tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600 tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660 tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720 tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780 ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840 tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900 gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960 agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020 ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080 gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140 agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200 acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260 acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320 tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380 tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440 acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500 gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560 tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620 tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680 gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740 cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800 ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860 actacgcttg a 4871 <210> 933 <211> 4805 <212> DNA <213> Artificial Sequence <220> <223> pXDP88 plasmid sequence <400> 933 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800 aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860 gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920 cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980 ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040 agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100 gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160 acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220 tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280 gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340 actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400 acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460 gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520 tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580 gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640 ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700 tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760 gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820 gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880 agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940 ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000 accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060 tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120 agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180 tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240 gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300 ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360 tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420 aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480 acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540 acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600 tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660 tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720 tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780 gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840 cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900 gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960 gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020 acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080 atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140 ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200 tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260 ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320 ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380 agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440 tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500 agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560 agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620 gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680 ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740 tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800 acgct 4805 <210> 934 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 934 Asp Cys Leu Asp Phe Asp Asn Asp 1 5 <210> 935 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 935 Asp Leu Val Leu Leu Ser Ala Glu 1 5 <210> 936 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 936 Pro Gln Val Met Ala Ala Val Ala 1 5 <210> 937 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 937 Ala Arg Gln Met Thr Ala His Thr 1 5 <210> 938 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 938 Ser Ser Leu Tyr Pro Val Leu Pro 1 5 <210> 939 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 939 Ser Ser Leu Tyr Pro Ala Leu Thr 1 5 <210> 940 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 940 Ala Gly Gly Arg Ser Trp Lys Ala 1 5 <210> 941 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 941 Ser Glu Glu Tyr Pro Ile Met Ile 1 5 <210> 942 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 942 Gly Gly Asn Tyr Pro Val Gln Gln 1 5 <210> 943 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 943 Arg Glu Val Tyr Pro Ile Val Asn 1 5 <210> 944 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 944 Thr Ser Cys Tyr His Cys Gly Thr 1 5 <210> 945 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 945 Pro Ala Ile Leu Pro Ile Ile Ser 1 5 <210> 946 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> cleavage site <400> 946 Pro Gln Val Leu Pro Val Met His 1 5 <210> 947 <211> 2413 <212> DNA <213> Artificial Sequence <220> <223> pStx42.174.12.7 plasmid sequence <400> 947 gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60 tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360 aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660 ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020 caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800 ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860 gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040 tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100 gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280 acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340 gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400 tttttttgaa ttc 2413 <210> 948 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 948 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 949 <211> 5178 <212> DNA <213> Artificial Sequence <220> <223> pXDP40 plasmid sequence <400> 949 atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60 ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120 agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180 agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240 ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300 ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360 cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420 ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480 atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540 tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660 gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720 gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780 ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840 gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960 gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020 aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080 gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140 gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200 gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260 cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320 cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380 gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440 agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500 tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560 cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620 atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680 cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cctggctatg 1740 accatggaac acaaggaccg gcctctggtg cgggtgatcc tgacaaatac cggctctcac 1800 cccgtgaagc agcggtcagt gtacatcaca gccctgctgg acagcggcgc tgatatcacc 1860 atcattagcg aggaggactg gcctaccgac tggcccgtga tggaagctgc caatccccag 1920 atccacggca tcggaggcgg aatcccgatg agaaagtcca gagacatgat cgaggtgggc 1980 gtgatcaacc gggacggctc tcttgagaga cctctgctgc tgttccccgc cgtggctatg 2040 gtgcgaggca gcatcctggg ccgcgactgc ctgcagggcc tgggcctgag actgaccaac 2100 ctgaacttta gccagggtgc caccagctgc taccactgcg gcaccggcgg cagcccaaag 2160 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 2220 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 2280 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 2340 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 2400 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 2460 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2520 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2580 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2640 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2700 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2760 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2820 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2880 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2940 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 3000 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 3060 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 3120 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 3180 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 3240 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 3300 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 3360 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 3420 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3480 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3540 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3600 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3660 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3720 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3780 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3840 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3900 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3960 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 4020 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 4080 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 4140 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 4200 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 4260 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 4320 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 4380 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 4440 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4500 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4560 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4620 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4680 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4740 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4800 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4860 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4920 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4980 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 5040 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 5100 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 5160 gtccctgact acgcttga 5178 <210> 950 <211> 5187 <212> DNA <213> Artificial Sequence <220> <223> pXDP41 plasmid sequence <400> 950 atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60 ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120 agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180 cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240 ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300 ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360 agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420 cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480 attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540 tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660 gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720 gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780 ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840 gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960 gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020 aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080 gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140 gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200 gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260 cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320 caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380 gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440 tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500 tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560 cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620 atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680 agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cctggctatg 1740 accatggaac acaaggacag acccctggtg cgggtgatcc tgacaaacac cggaagccac 1800 cccgtgaagc agcgctccgt gtacatcaca gcccttctgg acagcggcgc cgacatcacc 1860 atcatcagcg aggaagattg gcctacagac tggcctgtga tggaagccgc aaacccccag 1920 atccacggca tcggcggagg tatacccatg cggaagagca gagacatgat cgagctgggc 1980 gtgatcaacc gggacggcag cctggaacgg cccctgctgt tgtttcctgc tgtggctatg 2040 gtgcggggaa gcatcctggg cagagattgc ctgcagggcc tgggcctgcg cctgaccaac 2100 ctgtgaggag ggccactgtt ctcaggtgcc acatcttgtt accactgcgg caccggcggc 2160 agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 2220 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 2280 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 2340 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 2400 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2460 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2520 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2580 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2640 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2700 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2760 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2820 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2880 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2940 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 3000 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 3060 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 3120 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 3180 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 3240 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 3300 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 3360 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3420 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3480 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3540 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3600 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3660 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3720 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3780 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3840 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3900 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3960 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 4020 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 4080 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 4140 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 4200 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 4260 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 4320 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 4380 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4440 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4500 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4560 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4620 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4680 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4740 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4800 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4860 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4920 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4980 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 5040 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 5100 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 5160 ccatatgatg tccctgacta cgcttga 5187 <210> 951 <211> 5684 <212> DNA <213> Artificial Sequence <220> <223> pXDP42 plasmid sequence <400> 951 atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60 agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120 tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180 cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240 ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300 aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360 gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420 ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480 tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540 ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600 aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660 gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720 agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780 gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840 atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900 ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960 ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020 aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080 gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140 agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200 cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260 aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320 gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380 tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440 gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500 ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560 gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cccgcgctgt 1620 aaaaaaggaa agcattgggc acgagattgc cggtccaaaa cagatgttca aggtacccct 1680 ttacccccgg tgtcgggaaa ctgggtgagg ggccagcccc tggccccgaa acaatgttat 1740 ggggcaacac tgcaggttcc aaaagaacca ttgcagacct ctgtcgagcc acaagaggca 1800 gcgcgggatt ggacctctgt gccacctcct acacagtatt aactcccgag atgggggtcc 1860 aaaccctggc tacaggcgtg ttcggtcctc tgccccccgg caccgccggc ctgctgctgg 1920 gcagaagcag cgccagcctg aagggcatcc tgatccatcc tggagtgatt gacagcgact 1980 acaccggcga gatcaagatc ctggcctctg cccctaacaa gatcatcgtg atcaacgccg 2040 gccaaagaat cgcccagctg ctgctcgtgc ctctggtgat ccagggcaaa accatcaacc 2100 gggacaggca ggacaaggga tttggatctt ctgacgccta ttgggtgcag aacgtgaccg 2160 aggccagacc tgaactggaa cttagaatca atggcaagct gttccggggc gtgctggata 2220 caggcgccga catcagcgtg atcagcgaca aatactggcc caccacctgg cctaagcaga 2280 tggctatctc tacactgcag ggcatcggcc agacaaccaa ccccgagcag agcagcagcc 2340 tgctgacctg gaaggacaag gacggccaca ccggccaatt caagccctac atcctgcctc 2400 acctgcctgt gaacctgtgg ggcagagata tcctgagcaa gatgggcgtc tacctgtact 2460 cccctagccc taccgtgaca gatctgatgc tggaccaggg cctgctgcct aatcagggcc 2520 tcggaaagca acaccaggga attatcctgc cactggacct gaaaagcaac caggatagaa 2580 agggcctggg atgcttcccc tgaggacctc tgattctcct gggtgccgac tgcctggatt 2640 tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa gagatcaaga 2700 gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag gccggcaaga 2760 caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga gagcggctgg 2820 aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc agcagggcca 2880 acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg cacgtgtact 2940 gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag cctgccagca 3000 agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat ctgaccacag 3060 ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt 3120 ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc gagcacgaga 3180 agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc gtgacctaca 3240 gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg accaaagaaa 3300 gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc tctggacctg 3360 tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc 3420 aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc 3480 tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg cctcctcagc 3540 ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg agaatgtggg 3600 tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag cctctgctga 3660 gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa gtggattggt 3720 gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat ggcaaggttt 3780 tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac ctgagcagcg 3840 aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac ctgctgctgc 3900 acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc tgggagagaa 3960 tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa agaaggagcg 4020 aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc agctttgtga 4080 tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg aagctgcaga 4140 agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac agcatcctgg 4200 acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa gacggcgtca 4260 agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg cggttcaaga 4320 agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac aaaaagtccg 4380 gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg attatcctgc 4440 ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg ctgagcctgg 4500 aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg tacaacagga 4560 gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga agagaggtgc 4620 tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc gagaatatcc 4680 ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc aaggactccc 4740 tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag cagaggacaa 4800 tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg aagtacgcca 4860 gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat ctgctgtact 4920 acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc ttcggccggc 4980 agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat tggctcacag 5040 ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg gcccagtata 5100 cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac gacagagtgc 5160 tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc aaagagctga 5220 aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc gtgaaggatc 5280 tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc agcagctgga 5340 caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc cacagacctg 5400 tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat gaacaggctg 5460 ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag aagtaccaga 5520 ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg cagagcttct 5580 acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa 5640 aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5684 <210> 952 <211> 5637 <212> DNA <213> Artificial Sequence <220> <223> pXDP43 plasmid sequence <400> 952 atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60 tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120 aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180 ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240 tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300 agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360 agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420 accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480 gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540 gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600 aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660 cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720 gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780 gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840 gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900 cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960 tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020 gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080 aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140 tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200 gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260 ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320 atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380 tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440 agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500 agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560 ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620 aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680 taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740 ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800 agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860 ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920 gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980 atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040 gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100 aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160 atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca ctgggtgcag 2220 gagatcagcg acagcagacc catgctgcac atcagcctga acggcagaag attcctgggc 2280 ctgctggaca ccggggccga taagacctgc atcgccggca gagattggcc cgccaactgg 2340 cctattcacc agaccgagag cagcctgcag ggcttgggaa tggcttgtgg cgtggctaga 2400 agctctcagc ctctgagatg gcagcacgag gataagtctg gcattatcca tcctttcgtg 2460 atccccacat tgccttttac cctctggggc cgggacatca tgaaagagat aaaggtgcgg 2520 ctgatgaccg atagcccaga cgacagccag gatctgacat ctctgtacgg cttaggtgcc 2580 gacctggtgc tgctgagcgc cgagggcggc agcccaaaga agaagcggaa ggtctctaga 2640 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2700 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2760 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2820 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2880 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2940 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 3000 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 3060 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 3120 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 3180 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 3240 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 3300 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 3360 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 3420 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 3480 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 3540 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 3600 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3660 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3720 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3780 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3840 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3900 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3960 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 4020 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 4080 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 4140 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 4200 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 4260 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 4320 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 4380 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 4440 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 4500 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 4560 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 4620 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4680 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4740 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4800 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4860 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4920 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4980 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 5040 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 5100 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 5160 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 5220 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 5280 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 5340 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 5400 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 5460 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 5520 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 5580 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 5637 <210> 953 <211> 5811 <212> DNA <213> Artificial Sequence <220> <223> pXDP44 plasmid sequence <400> 953 atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60 acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120 acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180 gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240 agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300 gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360 accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420 tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480 ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540 gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600 agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660 cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720 ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780 caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840 aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900 gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960 gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020 ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080 gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140 tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200 accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260 gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320 ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380 agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440 aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500 aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560 cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620 aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680 aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740 tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800 ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860 caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920 agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc ctgaaatggg 1980 gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040 cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100 tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160 tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220 acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccagcc 2280 tatcacctgt cagaagcctt ctctgaccct gtggctggac gacaagatgt tcaccggcct 2340 catcgacacc ggcgccgacg tgacaatcat caagctggaa gattggcctc caaattggcc 2400 cattacagat accctgacca acctgagagg catcggacag tccaacaacc ccaagcagag 2460 cagcaagtac ctgacatggc gggacaagga gaacaacagc ggcctgatca aaccttttgt 2520 gatccccaat ctgcctgtga acctgtgggg aagagatctg ctgtctcaga tgaagatcat 2580 gatgtgcagc ccaaacgaca tcgtgaccgc ccagatgctg gctcaaggct acagccccgg 2640 caaaggcctg ggcaagaaag agaatggaat cctgcaccct atccctaacc agggccagag 2700 caacaagaag ggcttcggca acttctgact gcggccattg acatacttgg tgccccacag 2760 gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811 <210> 954 <211> 4779 <212> DNA <213> Artificial Sequence <220> <223> pXDP45 plasmid sequence <400> 954 atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60 ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120 aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180 ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240 aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300 ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360 agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420 ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480 gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540 acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600 cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660 cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720 ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780 cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840 ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900 aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960 gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020 aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080 ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140 tggaagcgcg attgtcccac actgaagtcc aagaattaat agagggggga cttagcgccc 1200 cccaaaccat aacacctata acagattctc ttagtgaggc cgaattagaa tgcttactct 1260 ctattcctct ggcccggagc cgccctagcg tggccgtgta cctgagcggc ccttggctgc 1320 aaccttctca gaaccaggcc ctgatgctgg ttgatacagg cgccgagaac accgtgctgc 1380 ctcagaattg gctggtgcgg gactacccca gaatccctgc cgctgtgctg ggagccggag 1440 gcgtgtcccg gaacagatac aactggctgc agggccctct tacactggct ctgaaacctg 1500 aaggcccatt catcaccatc ccaaagatcc tggtcgacac cttcgacaag tggcagatcc 1560 tgggcagaga tgtgctgagc agactgcagg ccagcatcag catccccgag gaagtgcggc 1620 cccccgtggt gggcgtcttg gatgcccccc cgagccacat tggattagaa catctgcccc 1680 ccccacctga ggtgcctcaa ttccctttaa actagaggtg ccccagccat cctgcccatc 1740 atctccggcg gcagcccaaa gaagaagcgg aaggtctcta gacaagagat caagagaatc 1800 aacaagatca gaaggagact ggtcaaggac agcaacacaa agaaggccgg caagacaggc 1860 cccatgaaaa ccctgctcgt cagagtgatg acccctgacc tgagagagcg gctggaaaac 1920 ctgagaaaga agcccgagaa catccctcag cctatcagca acaccagcag ggccaacctg 1980 aacaagctgc tgaccgacta caccgagatg aagaaagcca tcctgcacgt gtactgggaa 2040 gagttccaga aagaccccgt gggcctgatg agcagagttg ctcagcctgc cagcaagaag 2100 atcgaccaga acaagctgaa gcccgagatg gacgagaagg gcaatctgac cacagccggc 2160 tttgcctgct ctcagtgtgg ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag 2220 aaaggcaagg cctacaccaa ctacttcggc agatgtaacg tggccgagca cgagaagctg 2280 attctgctgg cccagctgaa acctgagaag gactctgatg aggccgtgac ctacagcctg 2340 ggcaagtttg gacagagagc cctggacttc tacagcatcc acgtgaccaa agaaagcaca 2400 caccccgtga agcccctggc tcagatcgcc ggcaatagat acgcctctgg acctgtgggc 2460 aaagccctgt ccgatgcctg catgggaaca atcgccagct tcctgagcaa gtaccaggac 2520 atcatcatcg agcaccagaa ggtggtcaag ggcaaccaga agagactgga aagcctgagg 2580 gagctggccg gcaaagagaa cctggaatac cccagcgtga ccctgcctcc tcagcctcac 2640 acaaaagaag gcgtggacgc ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac 2700 ctgaacctgt ggcagaagct gaaactgtcc agggacgacg ccaagcctct gctgagactg 2760 aagggcttcc ctagcttccc tctggtggaa agacaggcca atgaagtgga ttggtgggac 2820 atggtctgca acgtgaagaa gctgatcaac gagaagaaag aggatggcaa ggttttctgg 2880 cagaacctgg ccggctacaa gagacaagaa gccctgaggc cttacctgag cagcgaagag 2940 gaccggaaga agggcaagaa gttcgccaga taccagctgg gcgacctgct gctgcacctg 3000 gaaaagaagc acggcgagga ctggggcaaa gtgtacgatg aggcctggga gagaatcgac 3060 aagaaggtgg aaggcctgag caagcacatt aagctggaag aggaaagaag gagcgaggac 3120 gcccaatcta aagccgctct gaccgattgg ctgagagcca aggccagctt tgtgatcgag 3180 ggcctgaaag aggccgacaa ggacgagttc tgcagatgcg agctgaagct gcagaagtgg 3240 tacggcgatc tgagaggcaa gcccttcgcc attgaggccg agaacagcat cctggacatc 3300 agcggcttca gcaagcagta caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa 3360 ctgaacctgt acctgatcat caattacttc aaaggcggca agctgcggtt caagaagatc 3420 aaacccgagg ccttcgaggc taacagattc tacaccgtga tcaacaaaaa gtccggcgag 3480 atcgtgccca tggaagtgaa cttcaacttc gacgacccca acctgattat cctgcctctg 3540 gccttcggca agagacaggg cagagagttc atctggaacg atctgctgag cctggaaacc 3600 ggctctctga agctggccaa tggcagagtg atcgagaaaa ccctgtacaa caggagaacc 3660 agacaggacg agcctgctct gtttgtggcc ctgaccttcg agagaagaga ggtgctggac 3720 agcagcaaca tcaagcccat gaacctgatc ggcgtggacc ggggcgagaa tatccctgct 3780 gtgatcgccc tgacagaccc tgaaggatgc ccactgagca gattcaagga ctccctgggc 3840 aaccctacac acatcctgag aatcggcgag agctacaaag agaagcagag gacaatccag 3900 gccaagaaag aggtggaaca gagaagagcc ggcggatact ctaggaagta cgccagcaag 3960 gccaagaatc tggccgacga catggtccga aacaccgcca gagatctgct gtactacgcc 4020 gtgacacagg acgccatgct gatcttcgag aatctgagca gaggcttcgg ccggcagggc 4080 aagagaacct ttatggccga gaggcagtac accagaatgg aagattggct cacagctaaa 4140 ctggcctacg agggactgag caagacctac ctgtccaaaa cactggccca gtatacctcc 4200 aagacctgca gcaattgcgg cttcaccatc accagcgccg actacgacag agtgctggaa 4260 aagctcaaga aaaccgccac cggctggatg accaccatca acggcaaaga gctgaaggtt 4320 gagggccaga tcacctacta caacaggtac aagaggcaga acgtcgtgaa ggatctgagc 4380 gtggaactgg acagactgag cgaagagagc gtgaacaacg acatcagcag ctggacaaag 4440 ggcagatcag gcgaggctct gagcctgctg aagaagaggt ttagccacag acctgtgcaa 4500 gagaagttcg tgtgcctgaa ctgcggcttc gagacacacg ccgatgaaca ggctgccctg 4560 aacattgcca gaagctggct gttcctgaga agccaagagt acaagaagta ccagaccaac 4620 aagaccaccg gcaacaccga caagagggcc tttgtggaaa cctggcagag cttctacaga 4680 aaaaagctga aagaagtctg gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta 4740 gccctcgagt acccatatga tgtccctgac tacgcttga 4779 <210> 955 <211> 5078 <212> DNA <213> Artificial Sequence <220> <223> pXDP46 plasmid sequence <400> 955 atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60 gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120 tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180 tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240 aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300 cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360 tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420 aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480 gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540 acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600 caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660 aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720 agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780 ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840 ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900 tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960 accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020 accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080 ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140 cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttaa cctctcctcc taccctgcag caggtgttcc 1320 tgaatcaaga tcctgccagc atcctgcctg tgatccccct cgaccccgct agaagacctg 1380 tgatcaaggc ccaggtggac acacagacct cccaccccaa aacaatcgag gccctgctgg 1440 acaccggcgc tgatatgaca gtgctgccaa tcgccctgtt cagcagcaac acccctctga 1500 aaaacaccag cgtgctcgga gccggcggac agacccagga ccacttcaag ctgacaagcc 1560 tgcctgtcct gatccggctg cccttcagaa ccacacctat cgtgctgacc agctgcctgg 1620 tggacacaaa gaacaactgg gccatcatcg gcagggacgc cctgcaacag tgccagggcg 1680 tgctgtacct gccagaggcc aagggccccc ccgttatcct gcctatccag gcccctgccg 1740 tgctgggcct ggaacacctg ccaagacccc cccagatcag ccaatttcct ctgaaccaga 1800 acgccagcag accatgtaat acctggtccg gcagaccttg gcggcaggcc atttctaacc 1860 ccacccccgg ccaggagatc acccagtaca gccagctgaa gcggcctatg gaacctggag 1920 attctagcac cacctgcggc cctctgacac tgtgaccata gacctctcat catcttcccc 1980 cgggccccct gacttgtcca gcctgccaac cacacggtgc ccctcaagtg ctgccagtga 2040 tgcacggcgg cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca 2100 acaagatcag aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc 2160 ccatgaaaac cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc 2220 tgagaaagaa gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga 2280 acaagctgct gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag 2340 agttccagaa agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga 2400 tcgaccagaa caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct 2460 ttgcctgctc tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga 2520 aaggcaaggc ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga 2580 ttctgctggc ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg 2640 gcaagtttgg acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac 2700 accccgtgaa gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca 2760 aagccctgtc cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca 2820 tcatcatcga gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg 2880 agctggccgg caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca 2940 caaaagaagg cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc 3000 tgaacctgtg gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga 3060 agggcttccc tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca 3120 tggtctgcaa cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc 3180 agaacctggc cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg 3240 accggaagaa gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg 3300 aaaagaagca cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca 3360 agaaggtgga aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg 3420 cccaatctaa agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg 3480 gcctgaaaga ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt 3540 acggcgatct gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca 3600 gcggcttcag caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac 3660 tgaacctgta cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca 3720 aacccgaggc cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga 3780 tcgtgcccat ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg 3840 ccttcggcaa gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg 3900 gctctctgaa gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca 3960 gacaggacga gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca 4020 gcagcaacat caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg 4080 tgatcgccct gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca 4140 accctacaca catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg 4200 ccaagaaaga ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg 4260 ccaagaatct ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg 4320 tgacacagga cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca 4380 agagaacctt tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac 4440 tggcctacga gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca 4500 agacctgcag caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa 4560 agctcaagaa aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg 4620 agggccagat cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg 4680 tggaactgga cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg 4740 gcagatcagg cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag 4800 agaagttcgt gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga 4860 acattgccag aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca 4920 agaccaccgg caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa 4980 aaaagctgaa agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag 5040 ccctcgagta cccatatgat gtccctgact acgcttga 5078 <210> 956 <211> 5244 <212> DNA <213> Artificial Sequence <220> <223> pXDP47 plasmid sequence <400> 956 atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60 accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120 aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180 gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240 cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300 aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360 acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420 aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480 ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540 aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600 gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660 aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720 aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780 ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840 aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900 atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960 acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020 aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080 accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140 gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200 aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260 gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320 cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380 gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440 tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500 aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560 aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620 cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680 ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740 cctgcatgag acccaatcga ttgcccctat gagaagagcg gcacaaagac cacacaggac 1800 gtgatcacca caaagaatgc cgagatcatg gtgaccgtga accacacaaa gatcccaatg 1860 ctggtggata ccggcgcctg tctgacagca atcggaggag cagcaaccgt ggtgccagac 1920 ctgaagctga ccaacacaga gatcatcgca gtgggaatct ctgccgagcc cgtgcctcac 1980 gtgctggcca agccaaccaa gatccagatc gagaacacaa atatcgatat cagcccttgg 2040 tacaatccag accagacctt ccacatcctg ggccgcgaca cactgtctaa gatgcgggcc 2100 atcgtgagct ttgagaagaa cggcgagatg accgtgctgc tgcctccaac atatcacaag 2160 cagctgtcct gtcagaccaa gggtgccgca aggcagatga ccgcacacac aggcggcagc 2220 ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 2280 agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 2340 ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 2400 gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 2460 gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 2520 cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 2580 ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 2640 tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2700 accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2760 ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2820 agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2880 ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2940 gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 3000 cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 3060 gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 3120 gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 3180 aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 3240 ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 3300 aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 3360 tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 3420 aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 3480 gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 3540 ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 3600 gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3660 gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3720 ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3780 cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3840 atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3900 gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3960 gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 4020 cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 4080 gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 4140 gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 4200 cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 4260 gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 4320 ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 4380 gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 4440 gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 4500 atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 4560 gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 4620 ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4680 tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4740 gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4800 tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4860 ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4920 gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4980 ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 5040 tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 5100 accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 5160 gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 5220 tatgatgtcc ctgactacgc ttga 5244 <210> 957 <211> 4962 <212> DNA <213> Artificial Sequence <220> <223> pXDP48 plasmid sequence <400> 957 atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60 gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120 gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180 atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240 ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300 ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360 cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420 ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480 cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540 tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600 gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660 aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720 atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780 accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840 ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900 tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960 gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020 cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080 tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140 taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200 acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260 gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320 atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380 aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440 aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500 ctgctgaacc tgggcgatca ggagagccaa ggccaggacc cccctcctga gcctagaatc 1560 accctgaaga ttggaggcca gcctgtgacc tttctggtgg acaccggcgc ccaacactct 1620 gtgctgacca gacctgatgg ccccctcagc gatagaaccg ccctggtcca gggagctaca 1680 ggcagcaaga actacagatg gaccaccgac agaagggtgc agctggctac tggcaaggtg 1740 acacacagct ttctgtacgt gcccgagtgc ccttaccccc tcctgggcag agatctgttg 1800 acaaagctga aggcccaaat ccacttcacc ggagagggcg ctaatgtggt gggccccaag 1860 ggcctgcctc ttcaggtgct gacactgcaa ctggaagagg gtgccagctc tctgtaccct 1920 gtgctgcctg gcggcagccc aaagaagaag cggaaggtct ctagacaaga gatcaagaga 1980 atcaacaaga tcagaaggag actggtcaag gacagcaaca caaagaaggc cggcaagaca 2040 ggccccatga aaaccctgct cgtcagagtg atgacccctg acctgagaga gcggctggaa 2100 aacctgagaa agaagcccga gaacatccct cagcctatca gcaacaccag cagggccaac 2160 ctgaacaagc tgctgaccga ctacaccgag atgaagaaag ccatcctgca cgtgtactgg 2220 gaagagttcc agaaagaccc cgtgggcctg atgagcagag ttgctcagcc tgccagcaag 2280 aagatcgacc agaacaagct gaagcccgag atggacgaga agggcaatct gaccacagcc 2340 ggctttgcct gctctcagtg tggccagcct ctgttcgtgt acaagctgga acaggtgtcc 2400 gagaaaggca aggcctacac caactacttc ggcagatgta acgtggccga gcacgagaag 2460 ctgattctgc tggcccagct gaaacctgag aaggactctg atgaggccgt gacctacagc 2520 ctgggcaagt ttggacagag agccctggac ttctacagca tccacgtgac caaagaaagc 2580 acacaccccg tgaagcccct ggctcagatc gccggcaata gatacgcctc tggacctgtg 2640 ggcaaagccc tgtccgatgc ctgcatggga acaatcgcca gcttcctgag caagtaccag 2700 gacatcatca tcgagcacca gaaggtggtc aagggcaacc agaagagact ggaaagcctg 2760 agggagctgg ccggcaaaga gaacctggaa taccccagcg tgaccctgcc tcctcagcct 2820 cacacaaaag aaggcgtgga cgcctacaac gaagtgatcg ccagagtgag aatgtgggtc 2880 aacctgaacc tgtggcagaa gctgaaactg tccagggacg acgccaagcc tctgctgaga 2940 ctgaagggct tccctagctt ccctctggtg gaaagacagg ccaatgaagt ggattggtgg 3000 gacatggtct gcaacgtgaa gaagctgatc aacgagaaga aagaggatgg caaggttttc 3060 tggcagaacc tggccggcta caagagacaa gaagccctga ggccttacct gagcagcgaa 3120 gaggaccgga agaagggcaa gaagttcgcc agataccagc tgggcgacct gctgctgcac 3180 ctggaaaaga agcacggcga ggactggggc aaagtgtacg atgaggcctg ggagagaatc 3240 gacaagaagg tggaaggcct gagcaagcac attaagctgg aagaggaaag aaggagcgag 3300 gacgcccaat ctaaagccgc tctgaccgat tggctgagag ccaaggccag ctttgtgatc 3360 gagggcctga aagaggccga caaggacgag ttctgcagat gcgagctgaa gctgcagaag 3420 tggtacggcg atctgagagg caagcccttc gccattgagg ccgagaacag catcctggac 3480 atcagcggct tcagcaagca gtacaactgc gccttcattt ggcagaaaga cggcgtcaag 3540 aaactgaacc tgtacctgat catcaattac ttcaaaggcg gcaagctgcg gttcaagaag 3600 atcaaacccg aggccttcga ggctaacaga ttctacaccg tgatcaacaa aaagtccggc 3660 gagatcgtgc ccatggaagt gaacttcaac ttcgacgacc ccaacctgat tatcctgcct 3720 ctggccttcg gcaagagaca gggcagagag ttcatctgga acgatctgct gagcctggaa 3780 accggctctc tgaagctggc caatggcaga gtgatcgaga aaaccctgta caacaggaga 3840 accagacagg acgagcctgc tctgtttgtg gccctgacct tcgagagaag agaggtgctg 3900 gacagcagca acatcaagcc catgaacctg atcggcgtgg accggggcga gaatatccct 3960 gctgtgatcg ccctgacaga ccctgaagga tgcccactga gcagattcaa ggactccctg 4020 ggcaacccta cacacatcct gagaatcggc gagagctaca aagagaagca gaggacaatc 4080 caggccaaga aagaggtgga acagagaaga gccggcggat actctaggaa gtacgccagc 4140 aaggccaaga atctggccga cgacatggtc cgaaacaccg ccagagatct gctgtactac 4200 gccgtgacac aggacgccat gctgatcttc gagaatctga gcagaggctt cggccggcag 4260 ggcaagagaa cctttatggc cgagaggcag tacaccagaa tggaagattg gctcacagct 4320 aaactggcct acgagggact gagcaagacc tacctgtcca aaacactggc ccagtatacc 4380 tccaagacct gcagcaattg cggcttcacc atcaccagcg ccgactacga cagagtgctg 4440 gaaaagctca agaaaaccgc caccggctgg atgaccacca tcaacggcaa agagctgaag 4500 gttgagggcc agatcaccta ctacaacagg tacaagaggc agaacgtcgt gaaggatctg 4560 agcgtggaac tggacagact gagcgaagag agcgtgaaca acgacatcag cagctggaca 4620 aagggcagat caggcgaggc tctgagcctg ctgaagaaga ggtttagcca cagacctgtg 4680 caagagaagt tcgtgtgcct gaactgcggc ttcgagacac acgccgatga acaggctgcc 4740 ctgaacattg ccagaagctg gctgttcctg agaagccaag agtacaagaa gtaccagacc 4800 aacaagacca ccggcaacac cgacaagagg gcctttgtgg aaacctggca gagcttctac 4860 agaaaaaagc tgaaagaagt ctggaagccc gccgtgacta gtccaaaaaa gaagagaaag 4920 gtagccctcg agtacccata tgatgtccct gactacgctt ga 4962 <210> 958 <211> 5061 <212> DNA <213> Artificial Sequence <220> <223> pXDP49 plasmid sequence <400> 958 atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60 cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120 gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180 atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240 ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300 gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360 cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420 aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480 gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540 gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600 aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660 ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720 aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780 atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840 gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900 cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960 tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020 ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080 cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140 ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200 tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260 ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320 gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380 cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440 gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500 cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560 cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgattgagga 1620 ggacagggac aggagccacc tccagagccc agaatcaccc tgaaggtcgg cggccagcct 1680 gtgacctttc tggtggacac aggcgcccag cacagcgtgc tgacccagaa tcccggccct 1740 ctgtctgata agagcgcctg ggtgcaggga gcaacaggcg gcaagcggta cagatggacc 1800 acagaccgga aggtgcacct ggccaccggc aaggtgacac acagctttct gcacgtgccc 1860 gactgtccat accccctgct gggcagagat ctgctgacca agctgaaggc acagatccac 1920 ttcgagggat ccggagcaca ggtcatggga ccaatgggac agcctctgca ggtgctgaca 1980 ctgaacatcg aggatgaggg tgccagctcc ctgtatcctg ccctgacagg cggcagccca 2040 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 2100 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 2160 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 2220 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2280 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2340 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2400 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2460 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2520 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2580 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2640 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2700 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2760 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2820 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2880 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2940 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 3000 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 3060 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 3120 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 3180 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3240 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3300 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3360 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3420 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3480 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3540 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3600 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3660 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3720 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3780 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3840 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3900 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3960 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 4020 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 4080 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 4140 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 4200 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4260 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4320 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4380 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4440 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4500 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4560 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4620 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4680 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4740 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4800 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4860 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4920 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4980 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 5040 gatgtccctg actacgcttg a 5061 <210> 959 <211> 4757 <212> DNA <213> Artificial Sequence <220> <223> pXDP50 plasmid sequence <400> 959 atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60 gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120 ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180 aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240 acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300 atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360 atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420 agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480 gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540 gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600 gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720 cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780 agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840 aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900 gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960 aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020 ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080 ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140 ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200 tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260 agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320 gtgccgtccg ctcctcctat ggaataacaa gcgcccctcc aatggtgcag gtgcggattg 1380 gatctcagca gcgcaacctg ctgttcgaca ccggcgccga tagaaccatc gtccggtggc 1440 acgagggctc cggcaacccc gccggcagaa tcaaactgca aggcatcggc ggaatcgtgg 1500 aaggcgagaa gtggaacaac gtggagctgg aatacaaggg cgagacaaga aagggcacca 1560 tcgtggtgct gcctcagagc cctgtggagg tgctgggacg ggacaacatg gcccggttcg 1620 gcatcaagat catcatggct aatctggagg aaaaaagaat ccccatcacc aaggtgaagt 1680 tgaaagaggg atgtggtgcc gcaggaggcc ggtcctggaa ggccggcggc agcccaaaga 1740 agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga aggagactgg 1800 tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc ctgctcgtca 1860 gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag cccgagaaca 1920 tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg accgactaca 1980 ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg 2040 gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac aagctgaagc 2100 ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct cagtgtggcc 2160 agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc tacaccaact 2220 acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc cagctgaaac 2280 ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga cagagagccc 2340 tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag cccctggctc 2400 agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc gatgcctgca 2460 tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag caccagaagg 2520 tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc aaagagaacc 2580 tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc gtggacgcct 2640 acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg cagaagctga 2700 aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct agcttccctc 2760 tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc 2820 tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc ggctacaaga 2880 gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag ggcaagaagt 2940 tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac ggcgaggact 3000 ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca 3060 agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa gccgctctga 3120 ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag gccgacaagg 3180 acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg agaggcaagc 3240 ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc aagcagtaca 3300 actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac ctgatcatca 3360 attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc ttcgaggcta 3420 acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact 3480 tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag agacagggca 3540 gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg 3600 gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag cctgctctgt 3660 ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc aagcccatga 3720 acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg acagaccctg 3780 aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac atcctgagaa 3840 tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag gtggaacaga 3900 gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg gccgacgaca 3960 tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac gccatgctga 4020 tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt atggccgaga 4080 ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag ggactgagca 4140 agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc aattgcggct 4200 tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa accgccaccg 4260 gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc acctactaca 4320 acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac agactgagcg 4380 aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc gaggctctga 4440 gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg tgcctgaact 4500 gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga agctggctgt 4560 tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc aacaccgaca 4620 agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa gaagtctgga 4680 agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg 4740 tccctgacta cgcttga 4757 <210> 960 <211> 4821 <212> DNA <213> Artificial Sequence <220> <223> pXDP51 plasmid sequence <400> 960 atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60 ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120 cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180 gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240 gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300 tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360 agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420 cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480 tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540 ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600 atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660 cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720 cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780 atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840 gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900 caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960 gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020 gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080 acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140 cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200 gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260 aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320 agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380 ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440 ctggacagtt tgtgggagta aacatataac ctggagaagc gccccaccac aatcgtgctg 1500 atcaacgaca cccctctgaa cgtgctgctg gacacaggag ctgatacatc tgtgctcacc 1560 accgcccact acaaccggct gaagtacaga ggcagaaagt accagggcac cggcatcatc 1620 ggcgtgggcg gaaatgtgga aaccttcagc accccagtga ccattaagaa aaagggccgg 1680 cacatcaaaa ccagaatgct ggtcgccgac atccctgtga caatcctggg cagagatatc 1740 cttcaggact taggtgcagg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1800 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1860 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1920 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1980 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2040 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2100 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2160 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2220 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2280 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2340 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2400 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2460 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2520 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2580 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2640 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2700 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2760 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2820 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2880 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2940 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3000 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3060 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3120 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3180 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3240 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3300 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3360 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3420 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3480 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3540 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3600 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3660 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3720 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3780 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3840 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3900 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3960 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4020 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4080 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4140 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4200 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4260 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4320 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4380 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4440 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4500 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4560 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4620 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4680 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4740 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4800 gatgtccctg actacgcttg a 4821 <210> 961 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> pXDP52 plasmid sequence <400> 961 atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60 ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120 ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180 ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240 acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300 aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360 accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420 ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480 gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540 tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600 cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660 ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720 acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780 ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840 ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900 agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960 cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020 atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080 aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140 gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200 ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260 acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320 tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380 gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440 cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500 tctctctttg gagaagacca gtagttacag cctacatcga ggaacagcct gtggaagtgc 1560 tgctggatac aggagctgat gacagcatcg tggccggcat tgagctggga cctaactaca 1620 ccccaaagat cgtgggcggc atcggcggat tcatcaatac caaagagtac aaggacgtga 1680 agatcaaagt gctgggcaag gtgatcaagg gcaccatcat gaccggcgac acacccatca 1740 acatcttcgg cagaaacctg ctcaccgcca tgggcatgtc tctgaacctg cctatcgcca 1800 aggtcgaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860 ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920 acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980 tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040 agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100 tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160 tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220 tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280 tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340 gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400 aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460 tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520 ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580 caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640 agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700 accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760 aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820 ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880 aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940 acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000 aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060 gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120 aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180 ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240 ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300 tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360 ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420 ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480 tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540 tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600 tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660 tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720 tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780 ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840 tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900 gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960 agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020 ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080 gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140 agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200 acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260 acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320 tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380 tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440 acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500 gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560 tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620 tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680 gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740 cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800 ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860 actacgcttg a 4871 <210> 962 <211> 4700 <212> DNA <213> Artificial Sequence <220> <223> pXDP53 plasmid Sequence <400> 962 atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60 gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120 tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180 acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240 agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300 aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360 aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420 gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480 gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540 gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600 gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720 atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780 atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840 ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900 ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960 accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020 acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080 gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140 aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200 agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260 cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320 atgctgtgac agaggcccct cctaagatcg agatcaaggt gggcacaaga tggaagaaac 1380 tgctggtcga caccggcgct gataagacca tcgtgaccag ccacgacatg agcggcatcc 1440 ccaagggcag aatcatcctg cagggcattg gaggaatcat cgagggcgag aagtgggagc 1500 aggtgcacct gcagtacaag gacaagatca tccggggcac catcgtggtg ctcgccacat 1560 ctccagtgga agtgctggga agagataaca tgcgggaact gggcatcggc ctgatcatgg 1620 ctaacctgga agagaaaggt gccagggagg tgtatccaat cgtgaatggc ggcagcccaa 1680 agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc agaaggagac 1740 tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa accctgctcg 1800 tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag aagcccgaga 1860 acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg ctgaccgact 1920 acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag aaagaccccg 1980 tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag aacaagctga 2040 agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg 2100 gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag gcctacacca 2160 actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg gcccagctga 2220 aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt ggacagagag 2280 ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg aagcccctgg 2340 ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg tccgatgcct 2400 gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc gagcaccaga 2460 aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc ggcaaagaga 2520 acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa ggcgtggacg 2580 cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc 2640 tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc cctagcttcc 2700 ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc aacgtgaaga 2760 agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg gccggctaca 2820 agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag aagggcaaga 2880 agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg 2940 actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg gaaggcctga 3000 gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct aaagccgctc 3060 tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa gaggccgaca 3120 aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat ctgagaggca 3180 agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc agcaagcagt 3240 acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg tacctgatca 3300 tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag gccttcgagg 3360 ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc atggaagtga 3420 acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc aagagacagg 3480 gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg aagctggcca 3540 atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac gagcctgctc 3600 tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac atcaagccca 3660 tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc ctgacagacc 3720 ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca cacatcctga 3780 gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa gaggtggaac 3840 agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat ctggccgacg 3900 acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag gacgccatgc 3960 tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc tttatggccg 4020 agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac gagggactga 4080 gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc agcaattgcg 4140 gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag aaaaccgcca 4200 ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag atcacctact 4260 acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg gacagactga 4320 gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca ggcgaggctc 4380 tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc gtgtgcctga 4440 actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc agaagctggc 4500 tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc ggcaacaccg 4560 acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg aaagaagtct 4620 ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag tacccatatg 4680 atgtccctga ctacgcttga 4700 <210> 963 <211> 5479 <212> DNA <213> Artificial Sequence <220> <223> pXDP54 plasmid sequence <400> 963 agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60 tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180 cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240 ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300 aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360 ctgtctcatc attttggcaa agaattcgcc accatggccc tgaatgattt cgaccctatc 420 gccctccagg gctacctgcc ggcccctaga gtgctgcaac acaacgacat catcatctgc 480 agagctactt ctggcccctg gggcatcggc gacagataca acctgatcag gatccacctg 540 caagaccctg ccggacagcc ccttccaatc ccccagtggg agcctatccc taaccggacc 600 gccaaccccc ggacacagcc ctaccctgtg gtgtctgccc caatggctac cctggaaaac 660 atcctgaaca actttcacat cccccacggc gtgtccagat acggccccct ggaaggcgga 720 gattaccagc ctggcgaaca gtacagccaa ggcttctgcc ctgtgaccca ggccgagatt 780 gccctgctga acggccagca cctggaagaa gagatcacaa tcctgagaga gatcacccac 840 agactgatgc agggcgtgcg gcctcctgcc gtgcctcagg gccctgctcc tcctcctcct 900 ccagctcagc ctcctgctcc cctgcctgct ccaccaattg ggcctccacc tcccgctgcc 960 cctgcccccg ccccaggccc catgcctgtg ccccagcatc tgcctattac acatatcaga 1020 gccgtgatcg gcgaaacccc cgccaacatc cgcgaggtgc cactgtggct ggctagagcc 1080 gttcccgccc tgcagggagt gtaccccgtc caggacgccg tgatgagaag ccgcaccgtg 1140 aacgccctga ccgtgcggca ccctggactg gccctggaac ctctggagtg cggcagctgg 1200 caagagtgtc tggccgccct gtggcagaga accttcggcg ccaccgccct gcacgccctg 1260 ggcgataccc tgggtcagat cgcaaacagc gacggcatcg tgatggctat cgagctgggc 1320 ctgctctttt ccgatgataa ctgggacctg gtgtggggaa tctgtagaag attcctgccc 1380 ggccaggccg tctgcgtggc cgtgcaggcc agactggatc ccctgcccga caacgctaca 1440 agaatcgtga tgatcagcca catcatccgg gacgtgtacg ccatcctggg cctggaccct 1500 ctgggcagac ccatgcagca gacactgcct agacggaaca accagcctcc cagacagcag 1560 ccacagagac ggcagcagcc tagaagaacc ggcaaccagg aggaaagagg ccagcggaac 1620 cggggccggc agaacgccca gacccctcgg caggagggca acagactgca gaacagccag 1680 ctgcctggcc ctcgcgactg ccccaacaat agcaaccagc ctcggtaccc tctgcggcca 1740 aacccccagc agccccaaag atacggccag gagcagaatc gtggcaacaa tcccaaccct 1800 tacagacaac ctacccctgg caatggaaat caaaacagaa acttcagccg ggggcctgcc 1860 ccagtcaatg agcagagcag aggcagagga agatctagcc agggtacaaa taacaccggc 1920 tcctctgctg tgcacagcgt gcggctgacc agcgccgccc ctcctatacc cccacaagat 1980 gccggcactc cgcccacttc aagtggaaat caagggcaat catcttaaag gctactggga 2040 cagcggcgcc gagatcacat gcgtgcccgc tatctacatc atcgaggaac aacctgttgg 2100 caagaagctg attacaacca tccacaacga gaaggaacat gatgtgtact acgtggaaat 2160 gaaaatcgag aagcggaagg tgcagtgtga agtgatcgcc accgccctgg attacgtgct 2220 ggtggcccct gtggacatcc cctggtataa gcctggacct ctggaactga ccatcaagat 2280 cgacgtcgag agccagaagc acaccctgat cacagagtcc accctctctc cacagggcca 2340 gatgagactg aagaaactgc tggaccagta ccaggccctg tggcagtgct gggagaacca 2400 ggtgggccac agaagaggtg cctctgctgt gcacagcgtg cggctgggcg gcagcccaaa 2460 gaagaagcgg aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact 2520 ggtcaaggac agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt 2580 cagagtgatg acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa 2640 catccctcag cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta 2700 caccgagatg aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt 2760 gggcctgatg agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa 2820 gcccgagatg gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg 2880 ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa 2940 ctacttcggc agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa 3000 acctgagaag gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc 3060 cctggacttc tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc 3120 tcagatcgcc ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg 3180 catgggaaca atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa 3240 ggtggtcaag ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa 3300 cctggaatac cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc 3360 ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct 3420 gaaactgtcc agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc 3480 tctggtggaa agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa 3540 gctgatcaac gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa 3600 gagacaagaa gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa 3660 gttcgccaga taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga 3720 ctggggcaaa gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag 3780 caagcacatt aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct 3840 gaccgattgg ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa 3900 ggacgagttc tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa 3960 gcccttcgcc attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta 4020 caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat 4080 caattacttc aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc 4140 taacagattc tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa 4200 cttcaacttc gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg 4260 cagagagttc atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa 4320 tggcagagtg atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct 4380 gtttgtggcc ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat 4440 gaacctgatc ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc 4500 tgaaggatgc ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag 4560 aatcggcgag agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca 4620 gagaagagcc ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga 4680 catggtccga aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct 4740 gatcttcgag aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga 4800 gaggcagtac accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag 4860 caagacctac ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg 4920 cttcaccatc accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac 4980 cggctggatg accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta 5040 caacaggtac aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag 5100 cgaagagagc gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct 5160 gagcctgctg aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa 5220 ctgcggcttc gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct 5280 gttcctgaga agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga 5340 caagagggcc tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg 5400 gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga 5460 tgtccctgac tacgcttga 5479 <210> 964 <211> 5764 <212> DNA <213> Artificial Sequence <220> <223> pXDP55 plasmid sequence <400> 964 agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60 tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120 cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180 cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240 ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300 aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360 ctgtctcatc attttggcaa agaattcgcc accatgagcc agccctccgc ttctggcagc 420 gccggcgccg gaggcgcccc tcagcaacct cctcctccac ctccccagcc cggacctgcc 480 gcccccgtgc ctagagccca gatcggttat ggagatctgg acgtgcttct gctgcaacag 540 gagtaccacc tcatcgatcc taatctgcaa gtgcaacacc tggacaccct gctggtgaga 600 atcacaggcg gaaactgggg ccctggcgat agattcgcca gaatcgaggt gctgctccgc 660 gacacactgg gccctctgca acagcctaga tacagatacg ccgccatgca gcaggccgac 720 ctgagaaacg acatcatcct gcacctgaac taccaggatg ccatcatcat cttcgacatg 780 atcatcccca gcgagggcgt gcaccggcac ggccctatgt ttgacggcct gtggatccac 840 ggcgacgact acagcatgaa cttccagcct atcacagccc acgagctgta cctgctgcct 900 cagcaggtgc tgaccgagga agtggaactg ctcaccgagg tgtgcaacag aatggccgat 960 tggatccggc ggcacaggtg tggcggagga agcggctcct ctcagccacc tcctccccca 1020 cctccagccg tgccagtgct gcctagtgcc cctccagcca gcagcctgcc cctgccccca 1080 cagggctggg gcatctctcc tcccgtggct accagcaccc ctggcgctgc cggacattct 1140 agcagcgccg gtcctaacat cagcctgggc ggcacctacg tgccccctcc tgtggctcct 1200 ccagcccctg tgatcggcgg ccctggcgga cccggacagc tgcctgctat ggtgcaggtg 1260 ctgcccgctc aacctgtcgt gatccccatt aacgtgatca gatctgtgtg cggcgataca 1320 cctagcaacc ctcaagacat ccctctgtgg atgggcagaa tcatccccgc cattgagggc 1380 gtctttccta ttgacaaccc caatctgaga atgagagtgg tgaacgccct gctggctctg 1440 catcctggcc tggctatcac cgaactgaat gcccagacat ggggccaggt tctggctgtg 1500 ctgcacatgc gggccctggg acacaccgcc ctgcaccagc tgcctgccct gctggaaaca 1560 atcgtgaaga ccgacggcat cctgccagct tataacatgg gcatggaagt tacacagcag 1620 gatttcagct acgtgtgggg catcctgcgg acactgttgc ccggccaagc cttcgtgctg 1680 agcatgcaga acgagctgga ccggctgcct gccgcccaga gacctggaat gttccccggc 1740 ctgctgcaga gaaccctgga tatcctgggc ctgaacagca gaggacagaa catccagaaa 1800 accaacaccc agcagcaggc cccaaagcgg ggccagaagc ctaagcccag actgccccca 1860 gtgcacagac ggcctgcacc cttcacccct cctgccaccc ccagccctcg gcagcaggcc 1920 agcgccagcc ccagcagcca gggcgacaac agaagccctc agcctcaggg cagaggcaca 1980 tacggcccga gccggggagg cggctctggc cctagataca acttccgtcc cagagtgcag 2040 cctcccgaca gatacggctt cggcagaggc cagggaggca gaagcagcat cggcgcccag 2100 gacaatcagc agcccggaca aggcggacag cggacccagc agaccaacca gaaccgcaac 2160 cagggcaacg ccaccggcgg tagaacccag cctcagaata gaacagtgaa caccgtgcgg 2220 gtgacccaga ccaatcctca aggcggctcc tccgtgtcca acccagctgt gacaacttct 2280 cagaatacag gaacaggaag tgcaactcag agctcatcat cttaaaggct ttgtggacac 2340 aggcagcagc atcacctgct tccccaagta caccctggtc gaggaagatc ctatcggcca 2400 gtacgacatc agcaccatcc acggcacagt gtcccagcct gtgtactaca tcaagttcaa 2460 ggtgaacggc aagaaagtgg aagccgaggt gaccgagtct ccactggact acgtgatcct 2520 gtgtcctagc gacgtgccct ggctgtctac aaagctggaa ctgacaatta agctgcctct 2580 gcaccagcag caacaggagc tgctgagcaa gaccagagtg aatcaaaaac agctgcagaa 2640 actctttatc cagtatgatg acctgtggca gaagtgggag aaccaggttg gacaccggaa 2700 gggtgccaga acagtgaaca ccgtgcgggt gggcggcagc ccaaagaaga agcggaaggt 2760 ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2820 cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2880 tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2940 cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 3000 agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 3060 agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 3120 gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 3180 gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 3240 taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 3300 tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3360 catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3420 tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3480 cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3540 ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3600 cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3660 cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3720 cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3780 ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3840 gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3900 gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3960 gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 4020 cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 4080 ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 4140 agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 4200 atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 4260 ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 4320 ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4380 cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4440 cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4500 ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4560 gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4620 gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4680 cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4740 ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4800 gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4860 caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4920 atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4980 cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 5040 gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 5100 aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 5160 caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 5220 cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 5280 catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 5340 gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5400 caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5460 gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5520 acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5580 agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5640 ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5700 tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5760 ttga 5764 <210> 965 <211> 5404 <212> DNA <213> Artificial Sequence <220> <223> pXDP56 plasmid Sequence <400> 965 atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60 ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120 accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180 gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240 cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300 gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360 gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420 gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480 ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540 atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600 agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660 cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720 tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780 gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840 gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900 gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960 ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020 gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080 ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140 cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200 caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260 ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320 cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380 aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440 acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500 cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560 ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620 ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680 accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740 gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800 ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860 aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920 gcttccagcg gagatcaaag gaactaaact gttagcccat tgggacagcg gcgccaccat 1980 tacatgcgtg cccgagtcct tcctggaaga tgagcagcct atcaaacaga ccctgatcaa 2040 gacaatccac ggcgagaagc agcagaaagt gtactacctg acctttaaga tcaagggaag 2100 aaaggtggaa gctgaagtga tcgccagccc ttacgagtac atcctgctgt ctccaacaga 2160 cgtgccttgg ctgacacagc aacctctgca gctgaccatc ctggtccccc tgcaggagta 2220 tcaggataga atcctcaaca agaccgccct gcctgaggaa cagaagcaaa gactgaagac 2280 cctgttcgcc aagtacgaca ccctgtggca gcactgggag aaccaggtgg gccaccggcg 2340 gggtgccaga gccgtcaaca cagtgaccca gggcggcagc ccaaagaaga agcggaaggt 2400 ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2460 cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2520 tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2580 cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 2640 agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 2700 agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 2760 gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 2820 gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 2880 taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 2940 tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3000 catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3060 tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3120 cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3180 ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3240 cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3300 cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3360 cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3420 ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3480 gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3540 gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3600 gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 3660 cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 3720 ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 3780 agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 3840 atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 3900 ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 3960 ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4020 cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4080 cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4140 ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4200 gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4260 gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4320 cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4380 ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4440 gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4500 caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4560 atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4620 cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 4680 gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 4740 aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 4800 caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 4860 cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 4920 catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 4980 gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5040 caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5100 gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5160 acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5220 agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5280 ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5340 tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5400 ttga 5404 <210> 966 <211> 5140 <212> DNA <213> Artificial Sequence <220> <223> pXDP57 plasmid sequence <400> 966 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680 gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740 agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800 ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860 ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920 gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980 tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040 gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100 ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160 caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220 ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280 cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340 gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400 agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460 gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520 ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580 gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640 gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700 gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760 acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820 caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880 catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940 ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000 cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060 cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120 gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180 catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240 gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300 ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360 ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420 caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480 cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540 gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600 gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660 cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720 actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780 caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840 gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900 ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960 cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020 cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080 cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140 tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200 caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260 ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320 ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380 cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440 caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500 actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560 caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620 aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680 tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740 cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800 gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860 agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920 gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980 caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040 aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100 agccctcgag tacccatatg atgtccctga ctacgcttga 5140 <210> 967 <211> 4996 <212> DNA <213> Artificial Sequence <220> <223> pXDP58 plasmid sequence <400> 967 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500 tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560 tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620 gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680 gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740 cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800 tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860 agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920 gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980 gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040 caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100 agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160 ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220 cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280 cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340 cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400 gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460 cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520 tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580 ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640 gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700 gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760 ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820 ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880 caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940 actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000 ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060 gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120 acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180 cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240 gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300 gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360 cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420 cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480 cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540 ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600 ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660 cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720 caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780 agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840 cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900 tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960 cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020 aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080 cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140 aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200 ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260 cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320 gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380 gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440 caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500 ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560 caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620 agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680 cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740 cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800 cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860 gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920 gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980 ccctgactac gcttga 4996 <210> 968 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP59 plasmid sequence <400> 968 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980 atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040 catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160 gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220 ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280 gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340 tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 969 <211> 5401 <212> DNA <213> Artificial Sequence <220> <223> pXDP60 plasmid sequence <400> 969 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980 ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040 catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100 ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160 gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220 ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280 gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340 tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400 tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460 aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520 cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580 caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640 catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700 tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760 gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820 caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880 cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940 tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000 ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060 atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120 cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180 gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240 gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300 cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360 cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420 caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480 agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540 gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600 gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660 tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720 agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780 caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840 cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900 cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960 gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020 caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080 gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140 caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200 cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260 aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320 cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380 ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440 cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500 agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560 ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620 cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680 cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740 ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800 aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860 cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920 caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980 gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040 cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100 gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160 cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220 gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280 aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340 tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400 a 5401 <210> 970 <211> 5811 <212> DNA <213> Artificial Sequence <220> <223> pXDP61 plasmid sequence <400> 970 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660 ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720 ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780 cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840 aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900 gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960 gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020 ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080 gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140 tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200 acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260 gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320 ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380 agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440 aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500 aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560 caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620 aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680 aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740 tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800 ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860 cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920 aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980 gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040 cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100 tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160 tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220 acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280 tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340 aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400 tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460 ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520 tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580 gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640 aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700 taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760 gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820 atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880 ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940 cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000 agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060 gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120 gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180 accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240 caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300 cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360 acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420 aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480 ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540 aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600 gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660 cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720 atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780 ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840 gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900 aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960 agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020 ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080 gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140 aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200 tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260 ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320 atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380 ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440 ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500 aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560 atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620 agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680 aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740 gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800 aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860 gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920 aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980 tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040 ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100 ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160 ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220 cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280 agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340 gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400 aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460 agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520 agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580 caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640 taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700 agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760 aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811 <210> 971 <211> 5077 <212> DNA <213> Artificial Sequence <220> <223> pXDP62 plasmid sequence <400> 971 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420 aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480 gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540 actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600 catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660 aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720 cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780 ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840 ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900 tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960 actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020 accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080 gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140 cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320 ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380 taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440 atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500 aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560 ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620 ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680 tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740 tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800 acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860 ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920 attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980 cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040 gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100 caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160 catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220 gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280 caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340 gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400 cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460 tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520 aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580 tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640 caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700 ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760 agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820 catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880 gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940 aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000 gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060 gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120 ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180 gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240 ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300 aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360 gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420 ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480 cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540 cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600 cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660 gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720 acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780 cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840 cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900 ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960 acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020 cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080 gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140 ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200 caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260 caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320 gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380 gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440 ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500 gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560 gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620 gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680 ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740 cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800 gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860 cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920 gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980 aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040 cctcgagtac ccatatgatg tccctgacta cgcttga 5077 <210> 972 <211> 4871 <212> DNA <213> Artificial Sequence <220> <223> pXDP63 plasmid sequence <400> 972 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420 ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480 gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540 tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600 caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660 ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720 actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780 ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840 ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900 agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960 caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020 atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080 aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140 gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200 ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260 acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320 tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380 gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440 cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500 tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560 tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620 cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680 aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740 atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800 aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860 ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920 acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980 tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040 agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100 tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160 tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220 tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280 tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340 gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400 aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460 tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520 ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580 caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640 agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700 accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760 aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820 ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880 aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940 acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000 aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060 gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120 aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180 ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240 ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300 tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360 ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420 ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480 tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540 tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600 tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660 tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720 tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780 ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840 tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900 gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960 agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020 ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080 gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140 agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200 acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260 acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320 tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380 tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440 acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500 gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560 tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620 tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680 gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740 cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800 ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860 actacgcttg a 4871 <210> 973 <211> 4805 <212> DNA <213> Artificial Sequence <220> <223> pXDP88 plasmid sequence <400> 973 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800 aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860 gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920 cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980 ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040 agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100 gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160 acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220 tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280 gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340 actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400 acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460 gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520 tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580 gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640 ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700 tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760 gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820 gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880 agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940 ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000 accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060 tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120 agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180 tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240 gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300 ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360 tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420 aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480 acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540 acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600 tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660 tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720 tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780 gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840 cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900 gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960 gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020 acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080 atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140 ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200 tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260 ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320 ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380 agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440 tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500 agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560 agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620 gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680 ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740 tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800 acgct 4805 <210> 974 <211> 2413 <212> DNA <213> Artificial Sequence <220> <223> pStx42.174.12.7 plasmid sequence <400> 974 gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60 tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360 aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660 ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020 caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800 ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860 gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040 tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100 gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280 acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340 gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400 tttttttgaa ttc 2413 <210> 975 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 975 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 976 <211> 4794 <212> DNA <213> Artificial Sequence <220> <223> pXDP127 plasmid sequence <400> 976 atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60 ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120 agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180 agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240 ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300 ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360 cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420 ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480 atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540 tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660 gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720 gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780 ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840 gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960 gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020 aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080 gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140 gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200 gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260 cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320 cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380 gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440 agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500 tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560 cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620 atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680 cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cggtgccacc 1740 agctgctacc actgcggcac cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1800 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1860 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1920 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1980 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2040 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2100 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2160 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2220 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2280 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2340 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2400 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2460 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2520 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2580 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2640 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2700 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2760 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2820 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2880 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2940 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3000 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3060 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3120 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3180 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3240 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3300 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3360 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3420 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3480 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3540 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3600 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3660 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3720 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3780 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3840 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3900 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3960 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4020 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4080 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4140 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4200 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4260 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4320 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4380 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4440 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4500 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4560 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4620 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4680 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4740 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4794 <210> 977 <211> 4320 <212> DNA <213> Artificial Sequence <220> <223> pXDP128 plasmid sequence <400> 977 atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60 ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120 aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180 ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240 aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300 ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360 agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420 ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480 gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540 acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600 cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660 cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720 ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780 cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840 ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900 aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960 gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020 aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080 ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140 tggaagcgcg attgtcccac actgaagtcc aagaatctaa tagagggggg acttagcgcc 1200 ccccaaacca taacacctat aacagattct cttagtgagg ccgaattaga atgcttaggt 1260 gccccagcca tcctgcccat catctccggc ggcagcccaa agaagaagcg gaaggtctct 1320 agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1380 aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1440 ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1500 aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1560 atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1620 gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1680 ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1740 aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 1800 gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 1860 gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 1920 cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 1980 tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2040 ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2100 aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2160 accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2220 agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2280 gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2340 aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2400 gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2460 ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2520 ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2580 gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2640 gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2700 aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 2760 gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 2820 gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 2880 cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 2940 aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3000 atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3060 aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3120 gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3180 accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3240 gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3300 cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3360 agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3420 gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3480 tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3540 agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3600 agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3660 gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3720 acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 3780 gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 3840 aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 3900 aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 3960 gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4020 tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4080 gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4140 tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4200 acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4260 ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttga 4320 <210> 978 <211> 4407 <212> DNA <213> Artificial Sequence <220> <223> pXDP129 plasmid sequence <400> 978 atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60 gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120 ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180 aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240 acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300 atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360 atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420 agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480 gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540 gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600 gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720 cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780 agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840 aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900 gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960 aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020 ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080 ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140 ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200 tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260 agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320 gtgccgtccg ctcctcctat ggaaggtgcc gcaggaggcc ggtcctggaa ggccggcggc 1380 agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1440 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1500 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1560 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1620 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1680 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1740 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1800 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1860 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 1920 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 1980 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2040 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2100 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2160 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2220 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2280 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2340 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2400 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2460 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2520 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2580 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2640 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2700 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2760 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2820 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 2880 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 2940 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3000 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3060 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3120 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3180 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3240 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3300 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3360 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3420 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3480 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3540 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3600 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3660 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3720 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3780 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3840 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 3900 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 3960 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4020 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4080 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4140 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4200 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4260 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4320 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4380 ccatatgatg tccctgacta cgcttga 4407 <210> 979 <211> 4521 <212> DNA <213> Artificial Sequence <220> <223> pXDP130 plasmid sequence <400> 979 atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60 ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120 cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180 gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240 gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300 tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360 agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420 cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480 tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540 ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600 atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660 cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720 cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780 atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840 gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900 caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960 gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020 gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080 acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140 cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200 gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260 aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320 agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380 ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440 ctggacagtt tgtgggaggg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1500 aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1560 ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1620 gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1680 aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1740 tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1800 gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1860 aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1920 ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1980 aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2040 aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2100 gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2160 gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2220 tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2280 aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2340 aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2400 gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2460 ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2520 cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2580 aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2640 aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2700 aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2760 gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2820 agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2880 ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2940 aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3000 aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3060 tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3120 atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3180 gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3240 aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3300 ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3360 aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3420 ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3480 atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3540 cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3600 agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3660 cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3720 gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3780 ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3840 gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3900 agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3960 ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4020 accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4080 tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4140 agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4200 ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4260 aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4320 ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4380 gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4440 tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4500 gatgtccctg actacgcttg a 4521 <210> 980 <211> 4674 <212> DNA <213> Artificial Sequence <220> <223> pXDP131 plasmid sequence <400> 980 atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60 agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120 tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180 cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240 ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300 aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360 gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420 ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480 tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540 ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600 aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660 gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720 agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780 gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840 atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900 ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960 ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020 aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080 gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140 agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200 cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260 aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320 gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380 tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440 gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500 ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560 gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cggtgccgac 1620 tgcctggatt tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1680 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1740 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1800 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1860 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 1920 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 1980 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2040 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2100 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2160 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2220 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2280 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2340 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2400 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2460 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2520 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2580 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2640 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2700 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2760 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2820 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 2880 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 2940 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3000 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3060 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3120 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3180 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3240 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3300 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3360 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3420 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3480 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3540 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3600 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3660 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3720 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3780 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3840 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 3900 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 3960 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4020 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4080 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4140 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4200 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4260 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4320 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4380 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4440 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4500 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4560 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4620 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4674 <210> 981 <211> 4569 <212> DNA <213> Artificial Sequence <220> <223> pXDP132 plasmid sequence <400> 981 atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60 gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120 gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180 atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240 ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300 ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360 cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420 ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480 cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540 tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600 gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660 aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720 atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780 accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840 ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900 tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960 gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020 cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080 tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140 taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200 acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260 gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320 atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380 aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440 aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500 ctgctgggtg ccagctctct gtaccctgtg ctgcctggcg gcagcccaaa gaagaagcgg 1560 aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1620 agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1680 acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1740 cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1800 aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1860 agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1920 gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1980 ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2040 agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2100 gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2160 tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2220 ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2280 atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2340 ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2400 cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2460 gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2520 agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2580 agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2640 gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2700 gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2760 taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2820 gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2880 aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2940 ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3000 tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3060 attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3120 ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3180 aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3240 tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3300 gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3360 atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3420 atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3480 ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3540 ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3600 ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3660 agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3720 ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3780 aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3840 aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3900 accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3960 ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4020 accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4080 accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4140 aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4200 gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4260 aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4320 gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4380 agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4440 tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4500 gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4560 tacgcttga 4569 <210> 982 <211> 4410 <212> DNA <213> Artificial Sequence <220> <223> pXDP133 plasmid sequence <400> 982 atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60 gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120 tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180 tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240 aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300 cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360 tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420 aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480 gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540 acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600 caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660 aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720 agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780 ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840 ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900 tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960 accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020 accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080 ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140 cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggagggttta acctctcctc ctaccctgca gcaggtgttc 1320 ctgaatcaag atcctgccag catcctgggt gcccctcaag tgctgccagt gatgcacggc 1380 ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 1440 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 1500 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 1560 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 1620 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 1680 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 1740 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 1800 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 1860 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 1920 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 1980 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2040 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2100 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2160 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2220 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2280 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2340 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 2400 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 2460 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 2520 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 2580 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 2640 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 2700 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 2760 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 2820 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 2880 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 2940 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3000 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3060 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3120 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3180 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3240 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3300 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3360 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 3420 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 3480 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 3540 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 3600 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 3660 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 3720 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 3780 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 3840 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 3900 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 3960 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4020 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4080 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4140 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4200 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4260 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4320 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4380 tacccatatg atgtccctga ctacgcttga 4410 <210> 983 <211> 4407 <212> DNA <213> Artificial Sequence <220> <223> pXDP134 plasmid sequence <400> 983 atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60 gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120 tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180 tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240 aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300 ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360 tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420 aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480 gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540 actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600 catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660 aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720 cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780 ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840 ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900 tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960 actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020 accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080 gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140 cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200 ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260 ccaaaaaact ccataggggg ggaggtttta acctcccccc ccacattaca gcaagtcttt 1320 cttaaccaag acccagcatc tattctggcc cctcaagtgc tgccagtgat gcacggcggc 1380 agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1440 aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1500 ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1560 cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1620 accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1680 gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1740 aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1800 cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1860 tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 1920 cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 1980 cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2040 cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2100 gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2160 caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2220 aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2280 gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2340 cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2400 agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2460 gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2520 ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2580 ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2640 ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2700 ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2760 gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2820 gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 2880 agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 2940 aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3000 ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3060 ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3120 gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3180 agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3240 ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3300 cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3360 aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3420 acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3480 atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3540 gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3600 gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3660 gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3720 atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3780 ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3840 aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 3900 accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 3960 acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4020 agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4080 gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4140 tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4200 agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4260 aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4320 gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4380 ccatatgatg tccctgacta cgcttga 4407 <210> 984 <211> 4677 <212> DNA <213> Artificial Sequence <220> <223> pXDP135 plasmid sequence <400> 984 atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60 cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120 gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180 atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240 ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300 gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360 cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420 aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480 gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540 gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600 aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660 ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720 aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780 atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840 gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900 cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960 tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020 ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080 cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140 ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200 tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260 ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320 gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380 cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440 gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500 cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560 cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgatggtgcc 1620 agctccctgt atcctgccct gacaggcggc agcccaaaga agaagcggaa ggtctctaga 1680 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1740 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1800 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1860 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1920 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1980 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2040 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2100 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2160 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2220 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2280 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2340 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2400 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2460 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2520 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2580 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2640 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2700 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2760 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2820 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2880 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2940 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3000 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3060 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3120 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3180 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3240 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3300 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3360 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3420 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3480 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3540 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3600 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3660 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3720 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3780 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3840 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3900 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3960 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4020 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4080 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4140 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4200 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4260 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4320 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4380 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4440 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4500 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4560 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4620 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4677 <210> 985 <211> 5274 <212> DNA <213> Artificial Sequence <220> <223> pXDP136 plasmid sequence <400> 985 atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60 tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120 aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180 ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240 tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300 agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360 agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420 accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480 gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540 gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600 aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660 cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720 gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780 gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840 gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900 cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960 tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020 gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080 aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140 tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200 gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260 ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320 atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380 tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440 agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500 agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560 ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620 aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680 taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740 ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800 agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860 ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920 gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980 atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040 gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100 aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160 atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca cggtgccgac 2220 ctggtgctgc tgagcgccga gggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2280 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2340 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2400 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2460 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2520 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2580 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2640 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2700 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2760 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2820 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2880 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2940 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 3000 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 3060 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 3120 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 3180 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3240 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3300 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3360 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3420 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3480 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3540 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3600 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3660 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3720 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3780 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3840 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3900 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3960 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 4020 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 4080 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 4140 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 4200 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4260 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4320 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4380 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4440 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4500 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4560 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4620 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4680 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4740 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4800 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4860 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4920 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4980 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 5040 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 5100 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 5160 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 5220 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5274 <210> 986 <211> 5034 <212> DNA <213> Artificial Sequence <220> <223> pXDP137 plasmid sequence <400> 986 atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60 acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120 acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180 gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240 agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300 gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360 accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420 tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480 ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540 gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600 agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660 cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720 ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780 caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840 aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900 gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960 gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020 ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080 gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140 tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200 accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260 gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320 ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380 agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440 aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500 aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560 cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620 aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680 aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740 tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800 ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860 caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920 agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc cggtgcccca 1980 caggtgatgg ctgctgtcgc cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2040 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2100 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2160 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2220 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2280 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2340 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2400 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2460 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2520 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2580 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2640 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2700 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2760 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2820 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2880 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2940 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3000 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3060 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3120 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3180 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3240 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3300 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3360 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3420 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3480 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3540 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3600 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3660 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3720 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3780 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3840 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3900 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3960 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4020 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4080 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4140 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4200 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4260 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4320 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4380 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4440 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4500 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4560 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4620 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4680 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4740 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4800 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4860 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4920 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4980 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5034 <210> 987 <211> 5034 <212> DNA <213> Artificial Sequence <220> <223> pXDP138 plasmid sequence <400> 987 atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60 acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120 acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180 gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240 tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300 gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360 acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420 agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480 ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540 gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600 cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660 ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720 ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780 cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840 aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900 gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960 gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020 ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080 gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140 tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200 acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260 gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320 ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380 agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440 aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500 aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560 caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620 aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680 aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740 tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800 ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860 cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920 aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc cggtgcccca 1980 caggtgatgg ctgctgtcgc cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2040 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2100 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2160 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2220 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2280 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2340 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2400 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2460 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2520 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2580 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2640 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2700 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2760 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2820 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2880 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2940 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3000 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3060 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3120 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3180 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3240 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3300 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3360 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3420 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3480 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3540 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3600 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3660 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3720 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3780 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3840 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3900 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3960 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4020 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4080 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4140 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4200 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4260 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4320 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4380 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4440 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4500 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4560 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4620 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4680 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4740 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4800 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4860 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4920 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4980 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5034 <210> 988 <211> 4794 <212> DNA <213> Artificial Sequence <220> <223> pXDP139 plasmid sequence <400> 988 atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60 ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120 agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180 cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240 ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300 ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360 agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420 cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480 attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540 tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600 gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660 gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720 gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780 ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840 gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900 ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960 gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020 aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080 gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140 gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200 gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260 cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320 caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380 gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440 tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500 tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560 cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620 atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680 agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cggtgccaca 1740 tcttgttacc actgcggcac cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1800 gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1860 gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1920 gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1980 agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2040 cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2100 cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2160 ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2220 gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2280 gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2340 gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2400 accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2460 tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2520 agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2580 ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2640 cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2700 agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2760 cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2820 gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2880 ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2940 ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3000 ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3060 tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3120 agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3180 agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3240 aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3300 agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3360 gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3420 cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3480 aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3540 attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3600 ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3660 tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3720 agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3780 gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3840 aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3900 cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3960 aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4020 ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4080 ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4140 tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4200 gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4260 gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4320 aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4380 gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4440 agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4500 cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4560 gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4620 aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4680 cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4740 aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4794 <210> 989 <211> 4584 <212> DNA <213> Artificial Sequence <220> <223> pXDP140 plasmid sequence <400> 989 atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60 ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120 ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180 ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240 acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300 aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360 accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420 ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480 gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540 tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600 cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660 ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720 acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780 ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840 ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900 agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960 cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020 atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080 aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140 gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200 ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260 acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320 tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380 gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440 cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500 tctctctttg gagaagacca gggtgccggc ggcaactacc ccgtgcagca aggcggcagc 1560 ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 1620 agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 1680 ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 1740 gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 1800 gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 1860 cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 1920 ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 1980 tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2040 accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2100 ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2160 agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2220 ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2280 gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 2340 cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 2400 gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 2460 gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 2520 aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 2580 ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 2640 aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 2700 tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 2760 aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 2820 gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 2880 ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 2940 gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3000 gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3060 ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3120 cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3180 atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3240 gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3300 gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 3360 cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 3420 gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 3480 gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 3540 cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 3600 gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 3660 ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 3720 gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 3780 gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 3840 atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 3900 gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 3960 ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4020 tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4080 gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4140 tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4200 ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4260 gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4320 ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 4380 tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 4440 accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 4500 gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 4560 tatgatgtcc ctgactacgc ttga 4584 <210> 990 <211> 4584 <212> DNA <213> Artificial Sequence <220> <223> pXDP141 plasmid sequence <400> 990 atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60 ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120 ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180 ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240 actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300 aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360 acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420 ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480 gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540 tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600 caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660 ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720 actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780 ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840 ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900 agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960 caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020 atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080 aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140 gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200 ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260 acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320 tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380 gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440 cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500 tctctctttg gagaagacca gggtgccggc ggcaactacc ccgtgcagca aggcggcagc 1560 ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 1620 agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 1680 ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 1740 gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 1800 gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 1860 cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 1920 ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 1980 tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2040 accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2100 ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2160 agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2220 ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2280 gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 2340 cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 2400 gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 2460 gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 2520 aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 2580 ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 2640 aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 2700 tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 2760 aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 2820 gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 2880 ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 2940 gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3000 gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3060 ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3120 cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3180 atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3240 gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3300 gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 3360 cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 3420 gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 3480 gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 3540 cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 3600 gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 3660 ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 3720 gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 3780 gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 3840 atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 3900 gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 3960 ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4020 tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4080 gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4140 tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4200 ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4260 gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4320 ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 4380 tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 4440 accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 4500 gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 4560 tatgatgtcc ctgactacgc ttga 4584 <210> 991 <211> 4389 <212> DNA <213> Artificial Sequence <220> <223> pXDP142 plasmid sequence <400> 991 atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60 gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120 tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180 acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240 agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300 aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360 aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420 gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480 gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540 gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600 gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660 gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720 atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780 atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840 ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900 ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960 accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020 acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080 gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140 aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200 agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260 cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320 atgctgggtg ccagggaggt gtatccaatc gtgaatggcg gcagcccaaa gaagaagcgg 1380 aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1440 agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1500 acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1560 cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1620 aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1680 agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1740 gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1800 ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 1860 agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 1920 gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 1980 tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2040 ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2100 atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2160 ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2220 cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2280 gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2340 agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2400 agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2460 gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2520 gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2580 taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2640 gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2700 aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2760 ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 2820 tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 2880 attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 2940 ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3000 aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3060 tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3120 gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3180 atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3240 atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3300 ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3360 ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3420 ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3480 agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3540 ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3600 aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3660 aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3720 accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3780 ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 3840 accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 3900 accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 3960 aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4020 gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4080 aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4140 gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4200 agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4260 tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4320 gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4380 tacgcttga 4389 <210> 992 <211> 4809 <212> DNA <213> Artificial Sequence <220> <223> pXDP143 plasmid sequence <400> 992 atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60 accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120 aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180 gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240 cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300 aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360 acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420 aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480 ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540 aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600 gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660 aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720 aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780 ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840 aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900 atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960 acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020 aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080 accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140 gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200 aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260 gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320 cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380 gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440 tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500 aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560 aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620 cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680 ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740 cctgcaggtg ccgcaaggca gatgaccgca cacacaggcg gcagcccaaa gaagaagcgg 1800 aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1860 agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1920 acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1980 cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 2040 aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 2100 agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 2160 gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 2220 ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2280 agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2340 gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2400 tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2460 ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2520 atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2580 ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2640 cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2700 gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2760 agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2820 agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2880 gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2940 gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 3000 taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 3060 gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 3120 aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 3180 ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3240 tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3300 attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3360 ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3420 aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3480 tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3540 gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3600 atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3660 atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3720 ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3780 ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3840 ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3900 agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3960 ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 4020 aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 4080 aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 4140 accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 4200 ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4260 accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4320 accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4380 aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4440 gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4500 aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4560 gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4620 agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4680 tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4740 gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4800 tacgcttga 4809 <210> 993 <211> 4698 <212> DNA <213> Artificial Sequence <220> <223> pXDP78 plasmid sequence <400> 993 atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60 ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120 agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180 cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240 tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300 tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360 ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420 atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480 cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540 ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600 cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660 gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720 gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780 ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840 ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900 ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960 tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020 ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080 gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140 cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200 aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260 gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320 aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380 cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440 aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500 tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560 gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620 gggcaatcat cttaaggtgc ctctgctgtg cacagcgtgc ggctgggcgg cagcccaaag 1680 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1740 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1800 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1860 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1920 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1980 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2040 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2100 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2160 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2220 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2280 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2340 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2400 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2460 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2520 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2580 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2640 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2700 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2760 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2820 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2880 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2940 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3000 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3060 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3120 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3180 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3240 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3300 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3360 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3420 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3480 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3540 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3600 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3660 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3720 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3780 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3840 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3900 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3960 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4020 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4080 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4140 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4200 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4260 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4320 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4380 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4440 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4500 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4560 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4620 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4680 gtccctgact acgcttga 4698 <210> 994 <211> 4995 <212> DNA <213> Artificial Sequence <220> <223> pXDP79 plasmid sequence <400> 994 atgagccagc cctccgcttc tggcagcgcc ggcgccggag gcgcccctca gcaacctcct 60 cctccacctc cccagcccgg acctgccgcc cccgtgccta gagcccagat cggttatgga 120 gatctggacg tgcttctgct gcaacaggag taccacctca tcgatcctaa tctgcaagtg 180 caacacctgg acaccctgct ggtgagaatc acaggcggaa actggggccc tggcgataga 240 ttcgccagaa tcgaggtgct gctccgcgac acactgggcc ctctgcaaca gcctagatac 300 agatacgccg ccatgcagca ggccgacctg agaaacgaca tcatcctgca cctgaactac 360 caggatgcca tcatcatctt cgacatgatc atccccagcg agggcgtgca ccggcacggc 420 cctatgtttg acggcctgtg gatccacggc gacgactaca gcatgaactt ccagcctatc 480 acagcccacg agctgtacct gctgcctcag caggtgctga ccgaggaagt ggaactgctc 540 accgaggtgt gcaacagaat ggccgattgg atccggcggc acaggtgtgg cggaggaagc 600 ggctcctctc agccacctcc tcccccacct ccagccgtgc cagtgctgcc tagtgcccct 660 ccagccagca gcctgcccct gcccccacag ggctggggca tctctcctcc cgtggctacc 720 agcacccctg gcgctgccgg acattctagc agcgccggtc ctaacatcag cctgggcggc 780 acctacgtgc cccctcctgt ggctcctcca gcccctgtga tcggcggccc tggcggaccc 840 ggacagctgc ctgctatggt gcaggtgctg cccgctcaac ctgtcgtgat ccccattaac 900 gtgatcagat ctgtgtgcgg cgatacacct agcaaccctc aagacatccc tctgtggatg 960 ggcagaatca tccccgccat tgagggcgtc tttcctattg acaaccccaa tctgagaatg 1020 agagtggtga acgccctgct ggctctgcat cctggcctgg ctatcaccga actgaatgcc 1080 cagacatggg gccaggttct ggctgtgctg cacatgcggg ccctgggaca caccgccctg 1140 caccagctgc ctgccctgct ggaaacaatc gtgaagaccg acggcatcct gccagcttat 1200 aacatgggca tggaagttac acagcaggat ttcagctacg tgtggggcat cctgcggaca 1260 ctgttgcccg gccaagcctt cgtgctgagc atgcagaacg agctggaccg gctgcctgcc 1320 gcccagagac ctggaatgtt ccccggcctg ctgcagagaa ccctggatat cctgggcctg 1380 aacagcagag gacagaacat ccagaaaacc aacacccagc agcaggcccc aaagcggggc 1440 cagaagccta agcccagact gcccccagtg cacagacggc ctgcaccctt cacccctcct 1500 gccaccccca gccctcggca gcaggccagc gccagcccca gcagccaggg cgacaacaga 1560 agccctcagc ctcagggcag aggcacatac ggcccgagcc ggggaggcgg ctctggccct 1620 agatacaact tccgtcccag agtgcagcct cccgacagat acggcttcgg cagaggccag 1680 ggaggcagaa gcagcatcgg cgcccaggac aatcagcagc ccggacaagg cggacagcgg 1740 acccagcaga ccaaccagaa ccgcaaccag ggcaacgcca ccggcggtag aacccagcct 1800 cagaatagaa cagtgaacac cgtgcgggtg acccagacca atcctcaagg cggctcctcc 1860 gtgtccaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920 tcatcatctt aaggtgccag aacagtgaac accgtgcggg tgggcggcag cccaaagaag 1980 aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 2040 aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 2100 gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 2160 cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 2220 gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 2280 ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 2340 gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 2400 cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 2460 ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 2520 gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 2580 gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 2640 atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 2700 ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 2760 gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 2820 gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 2880 aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2940 ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 3000 gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 3060 atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 3120 caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 3180 gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 3240 ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 3300 cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 3360 gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 3420 gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 3480 ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 3540 tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 3600 tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 3660 agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 3720 aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 3780 gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 3840 agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3900 gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3960 ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 4020 ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 4080 ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 4140 agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 4200 gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 4260 ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 4320 cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 4380 acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 4440 accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 4500 tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 4560 aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 4620 gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 4680 ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 4740 ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 4800 ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 4860 agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4920 cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4980 cctgactacg cttga 4995 <210> 995 <211> 5010 <212> DNA <213> Artificial Sequence <220> <223> pXDP80 plasmid sequence <400> 995 atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60 ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120 accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180 gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240 cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300 gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360 gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420 gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480 ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540 atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600 agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660 cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720 tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780 gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840 gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900 gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960 ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020 gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080 ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140 cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200 caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260 ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320 cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380 aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440 acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500 cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560 ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620 ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680 accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740 gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800 ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860 aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920 gcttccagcg gagatcaaag gaactaaggt gccagagccg tcaacacagt gacccagggc 1980 ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 2040 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 2100 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 2160 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 2220 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 2280 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 2340 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 2400 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 2460 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2520 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2580 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2640 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2700 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2760 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2820 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2880 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2940 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 3000 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 3060 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 3120 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 3180 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 3240 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 3300 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 3360 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 3420 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3480 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3540 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3600 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3660 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3720 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3780 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3840 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3900 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3960 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 4020 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 4080 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 4140 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 4200 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 4260 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 4320 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 4380 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 4440 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4500 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4560 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4620 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4680 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4740 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4800 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4860 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4920 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4980 tacccatatg atgtccctga ctacgcttga 5010 <210> 996 <211> 4663 <212> DNA <213> Artificial Sequence <220> <223> pXDP81 plasmid sequence <400> 996 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa ggcggcagcc caaagaagaa gcggaaggtc tctagacaag agatcaagag 1680 aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac 1740 aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga 1800 aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa 1860 cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg 1920 ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa 1980 gaagatcgac cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc 2040 cggctttgcc tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc 2100 cgagaaaggc aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa 2160 gctgattctg ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag 2220 cctgggcaag tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag 2280 cacacacccc gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt 2340 gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca 2400 ggacatcatc atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct 2460 gagggagctg gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc 2520 tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt 2580 caacctgaac ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag 2640 actgaagggc ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg 2700 ggacatggtc tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt 2760 ctggcagaac ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga 2820 agaggaccgg aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca 2880 cctggaaaag aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat 2940 cgacaagaag gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga 3000 ggacgcccaa tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat 3060 cgagggcctg aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa 3120 gtggtacggc gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga 3180 catcagcggc ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa 3240 gaaactgaac ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa 3300 gatcaaaccc gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg 3360 cgagatcgtg cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc 3420 tctggccttc ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga 3480 aaccggctct ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag 3540 aaccagacag gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct 3600 ggacagcagc aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc 3660 tgctgtgatc gccctgacag accctgaagg atgcccactg agcagattca aggactccct 3720 gggcaaccct acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat 3780 ccaggccaag aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag 3840 caaggccaag aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta 3900 cgccgtgaca caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca 3960 gggcaagaga acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc 4020 taaactggcc tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac 4080 ctccaagacc tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct 4140 ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa 4200 ggttgagggc cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct 4260 gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac 4320 aaagggcaga tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt 4380 gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc 4440 cctgaacatt gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac 4500 caacaagacc accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta 4560 cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa 4620 ggtagccctc gagtacccat atgatgtccc tgactacgct tga 4663 <210> 997 <211> 4528 <212> DNA <213> Artificial Sequence <220> <223> pXDP82 plasmid sequence <400> 997 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaggcgg 1500 cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag 1560 aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac 1620 cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa 1680 gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct 1740 gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa 1800 agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa 1860 caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc 1920 tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc 1980 ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc 2040 ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg 2100 acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa 2160 gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc 2220 cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga 2280 gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg 2340 caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg 2400 cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg 2460 gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc 2520 tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa 2580 cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc 2640 cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa 2700 gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca 2760 cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga 2820 aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa 2880 agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga 2940 ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct 3000 gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag 3060 caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta 3120 cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc 3180 cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat 3240 ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa 3300 gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa 3360 gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga 3420 gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat 3480 caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct 3540 gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca 3600 catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga 3660 ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct 3720 ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga 3780 cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt 3840 tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga 3900 gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag 3960 caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa 4020 aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat 4080 cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga 4140 cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg 4200 cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt 4260 gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag 4320 aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg 4380 caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa 4440 agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta 4500 cccatatgat gtccctgact acgcttga 4528 <210> 998 <211> 4977 <212> DNA <213> Artificial Sequence <220> <223> pXDP83 plasmid sequence <400> 998 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977 <210> 999 <211> 4977 <212> DNA <213> Artificial Sequence <220> <223> pXDP84 plasmid sequence <400> 999 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977 <210> 1000 <211> 4805 <212> DNA <213> Artificial Sequence <220> <223> pXDP88 plasmid sequence <400> 1000 atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60 ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120 ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180 ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240 acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300 ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360 gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420 caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480 gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540 ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600 ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660 gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720 agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780 atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840 agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900 tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960 ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020 gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080 agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140 ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200 atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260 caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320 cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380 gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440 aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500 taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560 tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620 ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680 gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740 ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800 aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860 gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920 cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980 ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040 agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100 gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160 acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220 tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280 gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340 actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400 acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460 gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520 tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580 gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640 ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700 tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760 gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820 gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880 agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940 ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000 accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060 tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120 agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180 tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240 gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300 ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360 tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420 aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480 acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540 acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600 tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660 tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720 tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780 gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840 cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900 gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960 gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020 acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080 atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140 ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200 tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260 ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320 ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380 agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440 tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500 agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560 agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620 gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680 ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740 tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800 acgct 4805 <210> 1001 <211> 2413 <212> DNA <213> Artificial Sequence <220> <223> pStx42.174.12.7 plasmid sequence <400> 1001 gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60 tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360 aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660 ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020 caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800 ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860 gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920 agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980 aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040 tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100 gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160 aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220 tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280 acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340 gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400 tttttttgaa ttc 2413 <210> 1002 <211> 1536 <212> DNA <213> Artificial Sequence <220> <223> pGP2 plasmid sequence <400> 1002 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 1003 <211> 4698 <212> DNA <213> Artificial Sequence <220> <223> pXDP78 plasmid sequence <400> 1003 atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60 ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120 agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180 cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240 tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300 tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360 ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420 atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480 cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540 ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600 cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660 gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720 gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780 ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840 ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900 ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960 tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020 ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080 gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140 cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200 aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260 gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320 aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380 cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440 aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500 tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560 gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620 gggcaatcat cttaaggtgc ctctgctgtg cacagcgtgc ggctgggcgg cagcccaaag 1680 aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1740 gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1800 agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1860 atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1920 accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1980 ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2040 cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2100 cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2160 tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2220 cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2280 ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2340 cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2400 atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2460 gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2520 ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2580 tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2640 aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2700 ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2760 ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2820 agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2880 ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2940 tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3000 aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3060 accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3120 gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3180 cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3240 aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3300 aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3360 aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3420 ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3480 agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3540 ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3600 tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3660 aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3720 gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3780 atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3840 agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3900 atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3960 atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4020 aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4080 aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4140 ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4200 ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4260 aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4320 gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4380 agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4440 tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4500 ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4560 aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4620 aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4680 gtccctgact acgcttga 4698 <210> 1004 <211> 4995 <212> DNA <213> Artificial Sequence <220> <223> pXDP79 plasmid sequence <400> 1004 atgagccagc cctccgcttc tggcagcgcc ggcgccggag gcgcccctca gcaacctcct 60 cctccacctc cccagcccgg acctgccgcc cccgtgccta gagcccagat cggttatgga 120 gatctggacg tgcttctgct gcaacaggag taccacctca tcgatcctaa tctgcaagtg 180 caacacctgg acaccctgct ggtgagaatc acaggcggaa actggggccc tggcgataga 240 ttcgccagaa tcgaggtgct gctccgcgac acactgggcc ctctgcaaca gcctagatac 300 agatacgccg ccatgcagca ggccgacctg agaaacgaca tcatcctgca cctgaactac 360 caggatgcca tcatcatctt cgacatgatc atccccagcg agggcgtgca ccggcacggc 420 cctatgtttg acggcctgtg gatccacggc gacgactaca gcatgaactt ccagcctatc 480 acagcccacg agctgtacct gctgcctcag caggtgctga ccgaggaagt ggaactgctc 540 accgaggtgt gcaacagaat ggccgattgg atccggcggc acaggtgtgg cggaggaagc 600 ggctcctctc agccacctcc tcccccacct ccagccgtgc cagtgctgcc tagtgcccct 660 ccagccagca gcctgcccct gcccccacag ggctggggca tctctcctcc cgtggctacc 720 agcacccctg gcgctgccgg acattctagc agcgccggtc ctaacatcag cctgggcggc 780 acctacgtgc cccctcctgt ggctcctcca gcccctgtga tcggcggccc tggcggaccc 840 ggacagctgc ctgctatggt gcaggtgctg cccgctcaac ctgtcgtgat ccccattaac 900 gtgatcagat ctgtgtgcgg cgatacacct agcaaccctc aagacatccc tctgtggatg 960 ggcagaatca tccccgccat tgagggcgtc tttcctattg acaaccccaa tctgagaatg 1020 agagtggtga acgccctgct ggctctgcat cctggcctgg ctatcaccga actgaatgcc 1080 cagacatggg gccaggttct ggctgtgctg cacatgcggg ccctgggaca caccgccctg 1140 caccagctgc ctgccctgct ggaaacaatc gtgaagaccg acggcatcct gccagcttat 1200 aacatgggca tggaagttac acagcaggat ttcagctacg tgtggggcat cctgcggaca 1260 ctgttgcccg gccaagcctt cgtgctgagc atgcagaacg agctggaccg gctgcctgcc 1320 gcccagagac ctggaatgtt ccccggcctg ctgcagagaa ccctggatat cctgggcctg 1380 aacagcagag gacagaacat ccagaaaacc aacacccagc agcaggcccc aaagcggggc 1440 cagaagccta agcccagact gcccccagtg cacagacggc ctgcaccctt cacccctcct 1500 gccaccccca gccctcggca gcaggccagc gccagcccca gcagccaggg cgacaacaga 1560 agccctcagc ctcagggcag aggcacatac ggcccgagcc ggggaggcgg ctctggccct 1620 agatacaact tccgtcccag agtgcagcct cccgacagat acggcttcgg cagaggccag 1680 ggaggcagaa gcagcatcgg cgcccaggac aatcagcagc ccggacaagg cggacagcgg 1740 acccagcaga ccaaccagaa ccgcaaccag ggcaacgcca ccggcggtag aacccagcct 1800 cagaatagaa cagtgaacac cgtgcgggtg acccagacca atcctcaagg cggctcctcc 1860 gtgtccaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920 tcatcatctt aaggtgccag aacagtgaac accgtgcggg tgggcggcag cccaaagaag 1980 aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 2040 aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 2100 gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 2160 cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 2220 gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 2280 ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 2340 gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 2400 cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 2460 ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 2520 gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 2580 gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 2640 atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 2700 ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 2760 gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 2820 gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 2880 aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2940 ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 3000 gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 3060 atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 3120 caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 3180 gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 3240 ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 3300 cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 3360 gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 3420 gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 3480 ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 3540 tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 3600 tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 3660 agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 3720 aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 3780 gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 3840 agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3900 gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3960 ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 4020 ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 4080 ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 4140 agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 4200 gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 4260 ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 4320 cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 4380 acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 4440 accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 4500 tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 4560 aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 4620 gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 4680 ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 4740 ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 4800 ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 4860 agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4920 cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4980 cctgactacg cttga 4995 <210> 1005 <211> 5010 <212> DNA <213> Artificial Sequence <220> <223> pXDP80 plasmid sequence <400> 1005 atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60 ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120 accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180 gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240 cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300 gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360 gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420 gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480 ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540 atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600 agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660 cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720 tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780 gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840 gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900 gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960 ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020 gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080 ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140 cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200 caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260 ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320 cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380 aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440 acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500 cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560 ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620 ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680 accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740 gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800 ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860 aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920 gcttccagcg gagatcaaag gaactaaggt gccagagccg tcaacacagt gacccagggc 1980 ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 2040 agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 2100 accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 2160 aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 2220 ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 2280 aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 2340 aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 2400 tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 2460 gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2520 gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2580 ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2640 aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2700 tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2760 gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2820 ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2880 ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2940 tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 3000 cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 3060 aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 3120 gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 3180 aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 3240 cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 3300 gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 3360 aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 3420 gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3480 ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3540 agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3600 tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3660 gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3720 atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3780 aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3840 aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3900 gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3960 atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 4020 ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 4080 cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 4140 gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 4200 ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 4260 gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 4320 tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 4380 gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 4440 agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4500 aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4560 atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4620 gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4680 ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4740 gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4800 agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4860 ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4920 aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4980 tacccatatg atgtccctga ctacgcttga 5010 <210> 1006 <211> 4663 <212> DNA <213> Artificial Sequence <220> <223> pXDP81 plasmid sequence <400> 1006 atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60 atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120 gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180 cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240 tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300 cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360 cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420 gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480 atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540 cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600 cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660 cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720 tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780 gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840 tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900 ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960 ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020 cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080 gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140 ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200 gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260 agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320 cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380 agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440 tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500 caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560 agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620 ctacaacaaa ggcggcagcc caaagaagaa gcggaaggtc tctagacaag agatcaagag 1680 aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac 1740 aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga 1800 aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa 1860 cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg 1920 ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa 1980 gaagatcgac cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc 2040 cggctttgcc tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc 2100 cgagaaaggc aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa 2160 gctgattctg ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag 2220 cctgggcaag tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag 2280 cacacacccc gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt 2340 gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca 2400 ggacatcatc atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct 2460 gagggagctg gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc 2520 tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt 2580 caacctgaac ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag 2640 actgaagggc ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg 2700 ggacatggtc tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt 2760 ctggcagaac ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga 2820 agaggaccgg aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca 2880 cctggaaaag aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat 2940 cgacaagaag gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga 3000 ggacgcccaa tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat 3060 cgagggcctg aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa 3120 gtggtacggc gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga 3180 catcagcggc ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa 3240 gaaactgaac ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa 3300 gatcaaaccc gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg 3360 cgagatcgtg cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc 3420 tctggccttc ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga 3480 aaccggctct ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag 3540 aaccagacag gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct 3600 ggacagcagc aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc 3660 tgctgtgatc gccctgacag accctgaagg atgcccactg agcagattca aggactccct 3720 gggcaaccct acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat 3780 ccaggccaag aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag 3840 caaggccaag aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta 3900 cgccgtgaca caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca 3960 gggcaagaga acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc 4020 taaactggcc tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac 4080 ctccaagacc tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct 4140 ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa 4200 ggttgagggc cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct 4260 gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac 4320 aaagggcaga tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt 4380 gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc 4440 cctgaacatt gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac 4500 caacaagacc accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta 4560 cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa 4620 ggtagccctc gagtacccat atgatgtccc tgactacgct tga 4663 <210> 1007 <211> 4528 <212> DNA <213> Artificial Sequence <220> <223> pXDP82 plasmid sequence <400> 1007 atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60 cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120 ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180 gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240 ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300 cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360 cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420 gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480 atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540 ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600 agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660 gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720 agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780 gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840 ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900 ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960 attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020 aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080 cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140 aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200 gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260 aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320 ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380 ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440 ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaggcgg 1500 cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag 1560 aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac 1620 cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa 1680 gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct 1740 gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa 1800 agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa 1860 caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc 1920 tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc 1980 ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc 2040 ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg 2100 acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa 2160 gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc 2220 cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga 2280 gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg 2340 caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg 2400 cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg 2460 gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc 2520 tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa 2580 cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc 2640 cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa 2700 gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca 2760 cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga 2820 aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa 2880 agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga 2940 ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct 3000 gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag 3060 caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta 3120 cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc 3180 cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat 3240 ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa 3300 gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa 3360 gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga 3420 gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat 3480 caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct 3540 gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca 3600 catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga 3660 ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct 3720 ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga 3780 cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt 3840 tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga 3900 gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag 3960 caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa 4020 aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat 4080 cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga 4140 cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg 4200 cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt 4260 gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag 4320 aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg 4380 caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa 4440 agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta 4500 cccatatgat gtccctgact acgcttga 4528 <210> 1008 <211> 4977 <212> DNA <213> Artificial Sequence <220> <223> pXDP83 plasmid sequence <400> 1008 atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60 ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120 tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180 cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240 accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300 gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360 ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420 aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480 gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540 gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600 ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660 tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720 aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780 cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840 cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900 agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960 aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020 atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080 tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140 ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200 ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260 cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320 gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380 gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440 gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500 ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560 agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620 agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680 cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740 agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800 aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860 gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977 <210> 1009 <211> 4977 <212> DNA <213> Artificial Sequence <220> <223> pXDP84 plasmid sequence <400> 1009 atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60 ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120 tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180 cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240 accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300 ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360 ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420 gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480 gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540 gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600 ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660 tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720 aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780 cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840 cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900 agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960 aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020 atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080 tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140 ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200 ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260 cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320 gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380 gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440 ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500 caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560 ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620 cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680 cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740 cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800 aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860 accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920 ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980 caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040 aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100 agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160 accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220 ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280 cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340 aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400 ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460 gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520 gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580 gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640 gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700 ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760 agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820 ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880 gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940 aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000 gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060 gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120 tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180 gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240 gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300 gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360 gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420 ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480 aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540 aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600 ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660 aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720 ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780 ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840 ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900 agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960 ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020 ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080 aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140 aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200 gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260 ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320 gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380 ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440 tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500 ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560 gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620 atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680 agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740 gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800 aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860 tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920 aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977 <210> 1010 <211> 5 <212> PRT <213> Unknown <220> <223> TEV protease cleavage site <400> 1010 Leu Phe Gln Gly Pro 1 5

Claims (296)

  1. 다음을 인코딩하는 하나 이상의 핵산을 포함하는 전달 입자(XDP) 시스템:
    (a) 하나 이상의 레트로바이러스 성분;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  2. 제1항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  3. 제2항에 있어서, 상기 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  4. 제2항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질과 핵산 둘 모두를 포함하는, XDP 시스템.
  6. 제5항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  7. 제6항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  8. 제7항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  9. 제8항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  10. 제9항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  11. 제5항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 시스템.
  12. 제11항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 시스템.
  13. 제12항에 있어서, 상기 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  14. 제13항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 핵산은:
    (a) 레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 하나 이상의 프로테아제 절단 부위;
    (c) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
    (d) 레트로바이러스 gag-pol 폴리단백질; 및
    (e) 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 하나 이상의 상기 레트로바이러스 성분은 오르토레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 시스템.
  17. 제16항에 있어서, 상기 오르소레트로바이러스아과 바이러스가 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
  18. 제16항에 있어서, 상기 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  20. 제19항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  21. 제19항 또는 제20항에 있어서, 상기 하나 이상의 레트로바이러스 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782 및 234-339로 구성된 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  23. 제22항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  24. 제23항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  25. 제22항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  26. 제25항에 있어서, 상기 향성 인자는 XDP와 표적 세포의 세포 표면과의 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
  27. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  28. 제27항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  29. 제28항에 있어서, 상기 gag 폴리단백질은 N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 하나 이상의 핵산은
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 상기 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  32. 제31항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  33. 제31항에 있어서, 상기 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 서열의 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
  34. 제33항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G이고, 선택적으로 VSV-G 당단백질은 서열번호: 438의 서열을 포함하는, XDP 시스템.
  35. 제27항 내지 제34항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  36. 제35항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  37. 제36항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  38. 제37항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  39. 제38항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  40. 제39항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  41. 제39항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  42. 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK(서열번호: 131), PAAKRVKLD(서열번호: 132), RQRRNELKRSP(서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호: 135), VSRKRPRP(서열번호: 136), PPKKARED(서열번호: 137), PQPKKKPL(서열번호: 138), SALIKKKKKMAP(서열번호: 139), DRLRR(서열번호: 140), PKQKKRK(서열번호: 141), RKLKKKIKKL(서열번호: 142), REKKKFLKRR(서열번호: 143), KRKGDEVDGVDEVAKKKSKK(서열번호: 144), RKCLQAGMNLEARKTKK(서열번호: 145), PRPRKIPR(서열번호: 146), PPRKKRTVV(서열번호: 147), NLSKKKKRKREK(서열번호: 148), RRPSRPFRKP(서열번호: 149), KRPRSPSS(서열번호: 150), KRGINDRNFWRGENERKTR(서열번호: 151), PRPPKMARYDN(서열번호: 152), KRSFSKAF(서열번호: 153), KLKIKRPVK(서열번호: 154), PKTRRRPRRSQRKRPPT(서열번호: 156), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157), PKKKRKVPPPPAAKRVKLD(서열번호: 155), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로 구성된 서열의 군으로부터 선택되는 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  43. 제35항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  44. 제43항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
  45. 제44항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  46. 제45항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  47. 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  48. 제27항 내지 제47항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  49. 제48항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성된, XDP 시스템.
  50. 제48항 또는 제49항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  51. 제27항 내지 제50항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  52. 제51항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  53. 제52항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  54. 제51항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  55. 제54항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
  56. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  57. 제56항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  58. 제56항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
  59. 제56항 내지 제58항 중 어느 한 항에 있어서, 상기 핵산은
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
  60. 제56항 내지 제59항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  61. 제60항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  62. 제61항에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  63. 제62항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  64. 제56항 내지 제63항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  65. 제64항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  66. 제65항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  67. 제66항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
  68. 제67항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  69. 제68항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397, 또는 11의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  70. 제68항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  71. 제68항 내지 제70항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  72. 제64항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성되는 군으로부터 선택된 핵산인, XDP 시스템.
  73. 제72항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
  74. 제73항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  75. 제73항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  76. 제73항 내지 제75항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  77. 제56항 내지 제76항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  78. 제77항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  79. 제77항 또는 제78항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  80. 제56항 내지 제79항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  81. 제80항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  82. 제81항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  83. 제80항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  84. 제83항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  85. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  86. 제85항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  87. 제86항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
  88. 제85항 내지 제87항 중 어느 한 항에 있어서, 상기 핵산은,
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  89. 제85항 내지 제88항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  90. 제89항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  91. 제89항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  92. 제91항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  93. 제85항 내지 제92항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  94. 제93항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  95. 제94항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  96. 제95항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
  97. 제96항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  98. 제97항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  99. 제97항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  100. 제97항 내지 제99항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  101. 제93항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  102. 제101항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
  103. 제102항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  104. 제102항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  105. 제102항 내지 제104항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  106. 제85항 내지 제105항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  107. 제106항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  108. 제106항 또는 제107항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  109. 제85항 내지 제108항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  110. 제109항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  111. 제110항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  112. 제109항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  113. 제112항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  114. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  115. 제114항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  116. 제114항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
  117. 제114항 내지 제116항 중 어느 한 항에 있어서, 상기 핵산은,
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  118. 제114항 내지 제117항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  119. 제118항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  120. 제118항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  121. 제120항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  122. 제114항 내지 제121항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  123. 제122항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  124. 제123항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  125. 제124항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  126. 제125항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  127. 제126항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  128. 제126항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  129. 제126항 내지 제128항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  130. 제122항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  131. 제130항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
  132. 제131항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  133. 제131항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  134. 제131항 내지 제133항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  135. 제114항 내지 제134항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  136. 제135항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  137. 제135항 또는 제136항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  138. 제114항 내지 제137항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  139. 제138항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  140. 제139항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  141. 제139항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  142. 제141항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  143. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 감마레트로바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  144. 제143항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  145. 제144항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
  146. 제143항 내지 제145항 중 어느 한 항에 있어서, 핵산은
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  147. 제143항 내지 제146항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  148. 제147항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  149. 제147항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  150. 제149항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  151. 제143항 내지 제150항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  152. 제151항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  153. 제152항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  154. 제153항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  155. 제154항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  156. 제155항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  157. 제155항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  158. 제155항 내지 제157항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  159. 제151항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  160. 제159항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
  161. 제160항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  162. 제160항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  163. 제160항 내지 제162항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  164. 제143항 내지 제163항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  165. 제164항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  166. 제164항 또는 제165항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  167. 제164항 내지 제166항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  168. 제167항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  169. 제168항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  170. 제167항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  171. 제170항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  172. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 렌티바이러스 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  173. 제172항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  174. 제173항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드를 포함하는, XDP 시스템.
  175. 제172항 내지 제173항 중 어느 한 항에 있어서, 상기 핵산은,
    (a) Gag-Pol 폴리단백질;
    (b) 하나 이상의 프로테아제 절단 부위;
    (c) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (d) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  176. 제172항 내지 제175항 중 어느 한 항에 있어서, 상기 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
  177. 제176항에 있어서, 상기 렌티바이러스는 HIV-1인, XDP 시스템
  178. 제172항 내지 제177항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  179. 제178항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  180. 제178항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  181. 제180항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  182. 제172항 내지 제181항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  183. 제182항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  184. 제183항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  185. 제184항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  186. 제185항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  187. 제186항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  188. 제186항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  189. 제186항 내지 제188항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  190. 제182항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  191. 제190항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
  192. 제191항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  193. 제191항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  194. 제191항 내지 제193항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  195. 제172항 내지 제194항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  196. 제195항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  197. 제195항 또는 제196항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  198. 제195항 내지 제197항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  199. 제198항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  200. 제198항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  201. 제198항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  202. 제201항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  203. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
    (a) 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부;
    (b) 치료 페이로드; 및
    (c) 향성 인자.
  204. 제203항에 있어서, 상기 gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
  205. 제204항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드를 포함하는, XDP 시스템.
  206. 제203항 내지 제205항 중 어느 한 항에 있어서, 상기 핵산은,
    (a) HIV p1 펩티드;
    (b) HIV p6 펩티드;
    (c) Gag-Pol 폴리단백질;
    (d) 하나 이상의 프로테아제 절단 부위;
    (e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
    (f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
  207. 제203항 내지 제206항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
  208. 제207항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
  209. 제207항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
  210. 제209항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
  211. 제203항 내지 제210항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
  212. 제211항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
  213. 제212항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
  214. 제213항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
  215. 제214항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
  216. 제215항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
  217. 제216항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
  218. 제203항 내지 제217항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
  219. 제211항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
  220. 제219항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
  221. 제220항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
  222. 제221항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
  223. 제220항 내지 제222항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
  224. 제203항 내지 제223항 중 어느 한 항에 있어서,
    (a) 상기 성분은 단일 핵산 상에 인코딩되거나;
    (b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
    (c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
    (d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
    (e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
  225. 제224항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
  226. 제224항 또는 제225항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
  227. 제224항 내지 제226항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
  228. 제227항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
  229. 제228항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
  230. 제227항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
  231. 제230항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
  232. 제1항 내지 제231항 중 어느 한 항에 있어서, 상기 gag 폴리단백질 및 치료 페이로드는 융합 단백질로서 발현되는, XDP 시스템.
  233. 제232항에 있어서, 상기 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하지 않는, XDP 시스템.
  234. 제232항에 있어서, 상기 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
  235. 제232항 내지 제234항 중 어느 한 항에 있어서, 상기 융합 단백질은 gag 폴리단백질의 성분 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
  236. 제234항 및/또는 제235항에 있어서, 상기 절단 부위는 Gag-Pol 폴리단백질의 프로테아제, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제, 또는 비-레트로바이러스 이종성 프로테아제에 의해 절단될 수 있는, XDP 시스템.
  237. 제236항에 있어서, 상기 절단 부위는 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
  238. 제236항에 있어서, 상기 절단 부위는 Gag-Pol 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
  239. 제236항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택되는, XDP 시스템.
  240. 제239항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 PreScission(HRV3C 프로테아제)인, XDP 시스템.
  241. 제239항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV)인, XDP 시스템.
  242. 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
  243. 제242항에 있어서, 상기 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
  244. 제242항 또는 제243항에 있어서, 상기 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
  245. 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 화학적으로 변형된, XDP 시스템.
  246. 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 Psi 패키징 요소, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 또는 가매듭으로 구성된 군으로부터 선택된 요소를 포함하고, 여기서 요소는 MS2, PP7, Q베타, U1A 및 파지 R-고리로 구성된 군에서 선택된 CasX 내로 합체된 단백질에 대해 친화성을 갖는, XDP 시스템.
  247. 제1항 내지 제246항 중 어느 한 항의 XDP 시스템을 포함하는 진핵 세포.
  248. 제247항에 있어서, 상기 세포는 패키징 세포인, 진핵 세포.
  249. 제247항 또는 제248항에 있어서, 상기 진핵세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
  250. 제248항 또는 제249항에 있어서, 상기 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
  251. 제247항 내지 제250항 중 어느 한 항에 있어서, XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
  252. 치료 페이로드를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
    (a) XDP가 생성되도록 하는 조건 하에서 제248-251 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
    (b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
  253. 제252항의 방법에 의해 생성된 XDP.
  254. 제253항에 있어서, CasX 및 가이드 RNA의 RNP의 치료 페이로드 및, 선택적으로, 공여자 주형을 포함하는, XDP.
  255. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 세포를 제254항의 XDP와 접촉시키는 것을 포함하며, 여기서 상기 접촉은 RNP 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하는 것을 포함하고, 여기서 가이드 RNA에 의해 표적화된 표적 핵산은 CasX에 의해 변형되는, 방법.
  256. 제255항에 있어서, 상기 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
  257. 제255항에 있어서, 상기 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
  258. 제255항 내지 제257항 중 어느 한 항에 있어서, 상기 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
  259. 제255항 내지 제258항 중 어느 한 항에 있어서, 상기 세포는 시험관내 또는 생체외에서 변형되는, 방법.
  260. 제255항 내지 제258항 중 어느 한 항에 있어서, 상기 세포는 생체내에서 변형되는, 방법.
  261. 제260항에 있어서, 상기 XDP는 대상체에게 투여되는, 방법.
  262. 제261항에 있어서, 상기 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
  263. 제261항 또는 제262항에 있어서, 상기 XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
  264. 제261항 내지 제263항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
  265. 제264항에 있어서, 상기 XDP는 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 투여되는, 방법.
  266. 제261항 내지 제265항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량의 XDP를 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따라 대상체에게 투여되는, 방법.
  267. 제266항에 있어서, 상기 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여되는, 방법.
  268. RNP가 세포에 들어가도록 세포를 제253항 또는 제254항의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
  269. 제268항에 있어서, 상기 RNP는 표적 핵산에 결합하는, 방법.
  270. 제269항에 있어서, 상기 표적 핵산은 CasX에 의해 절단되는, 방법.
  271. 제268항 내지 제270항 중 어느 한 항에 있어서, 상기 세포는 시험관내에서 변형되는, 방법.
  272. 제268항 내지 제270항 중 어느 한 항에 있어서, 상기 세포는 생체내에서 변형되는, 방법.
  273. 제272항에 있어서, 상기 XDP는 대상체에게 투여되는, 방법.
  274. 제273항에 있어서, 상기 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
  275. 제272항 내지 제274항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
  276. 제275항에 있어서, 상기 XDP는 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 투여되는, 방법.
  277. 다음을 포함하는 XDP 입자:
    (a) 레트로바이러스 기질(MA) 폴리펩티드;
    (b) 상기 XDP 내에 캡슐화된 치료 페이로드; 및
    (c) 상기 XDP 표면 상에 합체된 향성 인자.
  278. 제277항에 있어서,
    (a) 캡시드 폴리펩티드(CA);
    (b) 뉴클레오캡시드 폴리펩티드(NC);
    (c) P2A 펩티드, P2B 펩티드;
    (d) P10 펩티드;
    (e) p12 펩티드
    (f) PP21/24 펩티드;
    (g) P12/P3/P8 펩티드;
    (h) P20 펩티드;
    (i) p1 펩티드; 및
    (j) p6 펩티드로부터 선택된 하나 이상의 레트로바이러스 성분을 추가로 포함하는, XDP 입자.
  279. 제277항 또는 제278항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 입자.
  280. 제279항에 있어서, 상기 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 입자.
  281. 제279항에 있어서, 상기 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 입자.
  282. 제277항 내지 제281항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 입자.
  283. 제282항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 입자.
  284. 제283항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 입자.
  285. 제284항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 입자.
  286. 제285항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 입자.
  287. 제286항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 입자.
  288. 제282항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 입자.
  289. 제288항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 입자.
  290. 제289항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 입자.
  291. 제290항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 입자.
  292. 제286항 내지 제291항 중 어느 한 항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 입자.
  293. 제277항 내지 제292항 중 어느 한 항에 있어서, 상기 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 입자.
  294. 제293항에 있어서, 상기 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 입자.
  295. 제293항에 있어서, 상기 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스스푸마바이러스로 구성된 군으로부터 선택되는, XDP 입자.
  296. 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한, 제1항 내지 제295항 중 어느 한 항의 XDP 입자, 또는 XDP 시스템.
KR1020227022874A 2019-12-06 2020-12-04 입자 전달 시스템 Withdrawn KR20220113442A (ko)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201962944982P 2019-12-06 2019-12-06
US62/944,982 2019-12-06
US202062968915P 2020-01-31 2020-01-31
US62/968,915 2020-01-31
US202062983460P 2020-02-28 2020-02-28
US62/983,460 2020-02-28
US202063035576P 2020-06-05 2020-06-05
US63/035,576 2020-06-05
US202063120864P 2020-12-03 2020-12-03
US63/120,864 2020-12-03
PCT/US2020/063488 WO2021113772A1 (en) 2019-12-06 2020-12-04 Particle delivery systems

Publications (1)

Publication Number Publication Date
KR20220113442A true KR20220113442A (ko) 2022-08-12

Family

ID=74046189

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227022874A Withdrawn KR20220113442A (ko) 2019-12-06 2020-12-04 입자 전달 시스템

Country Status (8)

Country Link
EP (1) EP4069716A1 (ko)
JP (1) JP2023504536A (ko)
KR (1) KR20220113442A (ko)
CN (1) CN115175921A (ko)
AU (1) AU2020398658A1 (ko)
CA (1) CA3159320A1 (ko)
IL (1) IL293591A (ko)
WO (1) WO2021113772A1 (ko)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020154500A1 (en) 2019-01-23 2020-07-30 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
JP7744011B2 (ja) 2019-06-07 2025-09-25 スクライブ・セラピューティクス・インコーポレイテッド 操作されたcasxシステム
JP2022536364A (ja) 2019-06-13 2022-08-15 ザ ジェネラル ホスピタル コーポレイション 操作されたヒト内在性ウイルス様粒子および細胞への送達のためのその使用方法
AU2021310950A1 (en) 2020-07-24 2023-02-16 President And Fellows Of Harvard College Enhanced virus-like particles and methods of use thereof for delivery to cells
JP2023552374A (ja) 2020-12-03 2023-12-15 スクライブ・セラピューティクス・インコーポレイテッド 操作されたクラス2 v型crisprシステム
WO2022120089A1 (en) 2020-12-03 2022-06-09 Scribe Therapeutics Inc. Compositions and methods for the targeting of ptbp1
EP4351660A2 (en) 2021-06-09 2024-04-17 Scribe Therapeutics Inc. Particle delivery systems
WO2023049742A2 (en) 2021-09-21 2023-03-30 Scribe Therapeutics Inc. Engineered casx repressor systems
US20250290093A1 (en) * 2022-04-29 2025-09-18 Cz Biohub Sf, Llc High capacity lentiviral vectors
JP2025520127A (ja) 2022-06-02 2025-07-01 スクライブ・セラピューティクス・インコーポレイテッド 操作されたクラス2タイプv crispr系
WO2023235888A2 (en) 2022-06-03 2023-12-07 Scribe Therapeutics Inc. COMPOSITIONS AND METHODS FOR CpG DEPLETION
WO2023240027A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Particle delivery systems
WO2023240074A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
KR20250035055A (ko) 2022-06-07 2025-03-11 스크라이브 테라퓨틱스 인크. Pcsk9의 표적화를 위한 조성물 및 방법
WO2023240162A1 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Aav vectors for gene editing
WO2023240157A2 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of dmd
WO2024129976A2 (en) * 2022-12-14 2024-06-20 Scribe Therapeutics Inc. Particle delivery systems
AU2024248139A1 (en) 2023-03-29 2025-09-25 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2024206620A1 (en) 2023-03-29 2024-10-03 Scribe Therapeutics Inc. Messenger rna encoding casx
WO2024206676A1 (en) 2023-03-29 2024-10-03 Scribe Therapeutics Inc. Compositions and methods for the targeting of lpa
WO2024206565A1 (en) 2023-03-29 2024-10-03 Scribe Therapeutics Inc. Repressor fusion protein systems
WO2024254518A2 (en) * 2023-06-07 2024-12-12 Nvelop Therapeutics, Inc. Compositions of lipid delivery particles and method of use thereof
WO2025072293A1 (en) 2023-09-27 2025-04-03 Scribe Therapeutics Inc. Optimized mrnas encoding casx proteins
CN117344061B (zh) * 2023-12-05 2024-02-27 云南省细胞质量检测评价中心有限公司 一种同时检测五种人源病毒ebv、hbv、hcv、hiv、hpv的方法、试剂盒、引物和探针及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
EP0681483B1 (en) 1993-01-26 2005-08-24 The Trustees of the University of Pennsylvania (a corporation of Pennsylvania) Compositions and methods for delivery of genetic material
US5962428A (en) 1995-03-30 1999-10-05 Apollon, Inc. Compositions and methods for delivery of genetic material
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
WO2012068627A1 (en) 2010-11-24 2012-05-31 The University Of Western Australia Peptides for the specific binding of rna targets
US10968253B2 (en) * 2015-10-20 2021-04-06 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
WO2018064371A1 (en) * 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
KR20200003160A (ko) * 2017-05-03 2020-01-08 바이오마린 파머수티컬 인크. 조혈모세포의 형질도입을 위한 개선된 렌티바이러스

Also Published As

Publication number Publication date
EP4069716A1 (en) 2022-10-12
JP2023504536A (ja) 2023-02-03
WO2021113772A1 (en) 2021-06-10
CN115175921A (zh) 2022-10-11
AU2020398658A1 (en) 2022-07-07
CA3159320A1 (en) 2021-06-10
IL293591A (en) 2022-08-01

Similar Documents

Publication Publication Date Title
KR20220113442A (ko) 입자 전달 시스템
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
AU2018240515B2 (en) Nucleic acids encoding CRISPR-associated proteins and uses thereof
AU2018330197B2 (en) Nuclease systems for genetic engineering
AU2019204982B2 (en) Recombinant HCMV and RhCMV Vectors and Uses Thereof
AU2018203835B2 (en) Recombinant dna constructs and methods for modulating expression of a target gene
AU2023214237A1 (en) Modified polynucleotides for the production of biologics and proteins associated with human disease
KR20230111189A (ko) 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도
KR20230057487A (ko) 게놈 조정을 위한 방법 및 조성물
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR20210138603A (ko) 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포
KR20220044811A (ko) Crispr/cas13을 사용하는 표적화된 트랜스-이어맞추기
AU2018201717A1 (en) Optimal maize loci
AU2018200955A1 (en) Optimal maize loci
KR102205348B1 (ko) 외인성 항원을 포함하는 인간 시토메갈로바이러스
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
KR20210082205A (ko) 레트로바이러스 인테그라제-Cas9 융합 단백질을 이용한 유도된 비상동 DNA 삽입에 의한 게놈 편집
KR20230129230A (ko) Bcl11a의 표적화를 위한 조성물 및 방법
KR20240029020A (ko) Dna 변형을 위한 crispr-트랜스포손 시스템
CN117157109A (zh) 腺病毒基因疗法载体
KR20230173074A (ko) 향상된 이종이식편 생존 및 관용을 위한 하나 이상의 변형된 유전자를 갖는 세포, 조직, 기관, 및 동물
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
KR20210053923A (ko) 항종양 면역 반응을 자극하는 키메라 종양 용해성 허피스바이러스
KR20240000580A (ko) 레트로바이러스 인테그라제-Cas 융합 단백질을 이용한 직접 비상동 DNA 삽입에 의한 게놈 편집 및 치료 방법
KR20230134487A (ko) Rna 구조체

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

PC1203 Withdrawal of no request for examination

St.27 status event code: N-1-6-B10-B12-nap-PC1203